本文由第三方AI基于17173文章http://news.17173.com/content/11282025/235412315.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
V4还没来 DeepSeekMath-V2数学模型来了:IMO奥赛金牌水平
2025-11-28 23:54:12
神评论
17173 新闻导语
DeepSeekMath-V2发布,IMO奥赛金牌水平!开源免费,超越GPT-5、Claude等顶级模型,数学推理能力全球领先。立即了解详情!
全网都在等DeepSeek发布V4大模型,然而好事多磨,这个模型一直没有问世,但DeepSeek也没闲着,时不时来个惊喜,今晚突然低调发布了DeepSeekMath-V2模型。
DeepSeekMath-V2是一款可自我验证的数学推理训练框架,基于 DeepSeek?V3.2?Exp?Base训练而来,通过LLM验证器自动审查生成的数学证明,并利用高难度样本持续优化性能。
目前该模型代码与权重已开源,发布于Hugging Face及GitHub平台。

这款模型强在哪里?先说结果,在IMO 2025和CMO 2024中均达到金牌水平,Putnam 2024获118/120分。
如果对比当前顶级的大模型,比如Claude Sonnet4、GPT-5、Gemini 2.5 Pro等,Basic测试中得分被DeepSeekMath-V2的99分远远甩开,Adveanced中也只比Gemini DeepThink的65.7分略低,这个模型也是谷歌特调的,也达到到了IMO金牌水平。
考虑到DeepSeekMath-V2的开源、免费等特性,可以说它是当前最强的数学模型了。
不过DeepSeek官方的说法倒是很谦虚,表示尽管仍有许多工作需要完成,这些结果表明,自我可验证的数学推理是一个可行的研究方向,可能有助于开发更强大的数学AI系统。
如果联系到DeepSeek最近几款特殊模型的表现,显然他们在V4发布之前积累了相当多的新技术新想法,在OCR、数学等方面表现惊艳,这么一想V4如果是全能型的多模态大模型,那就更值得期待了。



【来源:快科技】
热门测试游戏
- 1上线不足两月即停服!《绝地求生:盲点》3月30日正式停运
- 2索尼官宣PS5全系涨价:国行Pro版涨至6299元,4月2日起生效
- 3FPS游戏《THE FINALS》推出第十赛季“幻想联赛”
- 4《星球大战》需要像修复前传三部曲那样修正续集
- 5两款Steam游戏创意撞车,仅一款跻身畅销榜
- 6喜欢《红色沙漠》?不妨回去重温《Skyrim》
- 7据传《塞尔达传说:时之笛 3D》Switch 2重制版将于今年圣诞节推出,全新《星际火狐大冒险》今夏登场
- 8韩国涩游《棕色尘埃2》新皮肤PV发布,尻太大外网都要打码
- 9紧身盔甲大白腿!玩家分享《红色沙漠》性感美女合集
- 10停运前夕仍推大更!MMORPG《新世界》兑现承诺,多项优化上线

