-
V4还没来 DeepSeekMath-V2数学模型来了:IMO奥赛金牌水平
全网都在等DeepSeek发布V4大模型,然而好事多磨,这个模型一直没有问世,但DeepSeek也没闲着,时不时来个惊喜,今晚突然低调发布了DeepSeekMath-V2模型。DeepSeekMath-V2是一款可自我验...[详细]
2025-11-28 23:54:12 -
11月中文大模型基准测评出炉:GPT 5.1夺冠、DeepSeek开源第一
SuperCLUE公布了2025年11月中文大模型基准测评结果。本次测评围绕数学推理、科学推理、代码生成(含web开发)、幻觉控制、精确指令遵循五大核心任务展开,题目总量为822道新题,最终得分取各任务平均分。本次共测评...[详细]
-
Meta AI推理新论文:模型记住套路,推理token砍半
Meta 又一次在 AI 推理上“开了挂”。?一份新论文显示,Meta 的研究团队找到一种让大模型“用更少思维,想得更清楚”的办法。这篇论文名为《Metacognitive Reuse: Turning Recurring LLM Rea...[详细]
-
拒绝“熵崩塌”和“熵爆炸”,这项研究让大模型学会“精确探索”,推理成绩飙升
大语言模型在RLVR训练中面临的“熵困境”,有解了!2024年以来,以OpenAI o1、DeepSeek-R1、Kimi K1、Qwen3等为代表的大模型,在数学、代码和科学推理任务上取得了显著突破。这些进展很大程度上得益...[详细]
-
全自研芯片计算!百度智能云Qianfan-VL系列模型重磅开源
今日,百度智能云千帆正式推出全新视觉理解模型——Qianfan-VL,并全面开源。即日起至10月10日,用户可在百度智能云千帆平台免费体验8B、70B模型。据介绍,Qianfan-VL系列模型包含3B、8B和70B三个尺...[详细]
2025-09-22 23:12:33 -
美团发布高效推理模型 LongCat-Flash-Thinking,达到 SOTA 水平
美团 LongCat 团队正式发布全新高效推理模型 LongCat-Flash-Thinking。官方介绍称,在保持了 LongCat-Flash-Chat 极致速度的同时,全新发布的 LongCat-Flash-Thinking 更...[详细]
2025-09-22 21:54:02 -
谷歌研究:合成数据使大模型数学推理能力提升八倍
最近,来自谷歌、卡内基梅隆大学和 MultiOn 的联合研究团队发表了一项关于合成数据在大型模型训练中应用的新研究。据专注于人工智能发展的研究机构 Epoch AI 报告显示,目前全球约有 300 万亿个公开可用的高质量文本训练标记。...[详细]