本文由第三方AI基于17173文章http://news.17173.com/content/02042026/172438969.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
全球中文大模型战力榜发布:前三被海外包揽 国产有惊喜
2026-02-04 17:24:38
神评论
17173 新闻导语
2025中文大模型战力榜发布!海外包揽前三,国产Kimi、Qwen在代码、数学领域夺冠,惊喜不断。点击查看详细排名!
今天,SuperCLUE发布2025年年度中文大模型基准测评报告。
23个国内外模型参与角逐,覆盖数学推理、科学推理、代码生成等六大核心维度。
从结果来看,海外闭源模型依旧占据头部位置,Anthropic旗下的Claude-Opus-4.5-Reasoning以68.25分位居榜首。
谷歌的Gemini-3-Pro-Preview和OpenAI的GPT-5.2(high)分别以65.59分、64.32分紧随其后,包揽前三名。
不过,国产大模型正加速从跟跑向并跑迈进。国内开源最佳模型Kimi-K2.5-Thinking 和闭源最佳模型Qwen3-Max-Thinking,分别以61.50分、60.61分位列全球第四和第六。
在部分细分领域,国产模型表现亮眼,比如Kimi-K2.5-Thinking在代码生成任务中以53.33分夺冠,Qwen3-Max-Thinking在数学推理任务中与Gemini-3-Pro-Preview同获80.87分,并列全球第一。
从整体格局看,海内外开闭源模型差异显著。闭源阵营呈现海外领先、国产追赶态势,开源阵营则是国产主导、海外式微,国内开源模型Top5均大幅领先海外开源模型。

【来源:快科技】
今日热点
热门测试游戏
- 1《暗黑4》凭什么游戏倒退十年却更值得入手了?国服本体免费领!
- 2网石经典端游IP新作MMO《RF Online Next》全球服预约开启
- 3时隔6年再开新服!韩国武侠MMO《热血江湖》推出全新职业
- 4角色建模很哇塞!祖龙女性向新作《代号:神不言》首曝
- 5网游时光机:从百万玩家在线到逐渐凉凉,《劲舞团》到底经历了什么?
- 6探店网红白冰偷税超900万元被查 追缴并罚款共计超1891万元
- 7除了《古剑》还有大招?烛龙“盗墓”题材新作《吉时已到》首曝
- 8腾讯扩圈的又一步大棋!《失控进化》官宣定档
- 9怀旧周报:魔兽国服专属活动又让老外眼馋了,《失落的方舟》制作人新作进军开放世界
- 10《龙之谷怀旧服》5月末版本爆料!70级资料片即将重磅登场!

