本文由第三方AI基于17173文章http://news.17173.com/content/05282026/100219312.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
中外AI对决 国产三强只能争夺全球第五
2026-05-28 10:02:19
神评论
17173 新闻导语
中外AI对决:国产三强DeepSeek、Qwen、豆包冲击全球第五!SuperCLUE最新评测,海外模型霸榜前四,国产模型性价比突出,代码生成逼近头部。点击查看完整排名与差距分析。
SuperCLUE最新中文大模型测评结果出炉,全球第一梯队被海外模型牢牢占据,国产表现最好的三款模型,只能在全球第五名的位置上激烈竞争。
本次测评覆盖21款国内外主流模型,测评集包括六大任务:数学推理、科学推理、代码生成、智能体(任务规划)、精确指令遵循、幻觉控制,共492题。
Gemini、GPT-5.5、Claude-Opus、Gemini-Flash四款海外模型稳居前四,形成难以撼动的第一梯队。

DeepSeek-V4-Pro、Qwen3.7-Max、豆包Seed 2.0 Pro三款国产模型分数非常接近,组成国内第一梯队,全球排名集中在第五位附近,成为国产第一集团。
虽然整体仍有差距,但国产模型进步很明显。代码生成项目中,Qwen3.7-Max得分仅次于海外头部模型,差距不到2分。数学推理、科学推理等项目,国产模型也多次冲进全球前列。
性价比方面,国产模型优势突出,多款产品进入高性价比区间,用更低成本实现接近头部的效果。推理效能上,海外模型仍垄断高效能区,国产模型多处在中低区间,还有提升空间。
整体来看,国产大模型正在快速追赶,但全球第一梯队的格局暂时没变。

【来源:快科技】
热门测试游戏
- 1经典IP团战续作重燃亚丁战火 《天堂2:盟约》今日全平台正式上线
- 2预约已开启!韩国武侠MMORPG《血风》定档7月14日公测
- 3《天堂2:盟约》职业该怎么选?零氪微氪重氪对应职业全讲解
- 4《第九封印:无尽召唤》正式开启公测 主打骑乘战斗与幻兽养成
- 5一刀未剪展现全新江湖!《逆水寒:新世界》前15分钟完整实机演示
- 6《天下贰老友服》我们想给所有天下贰玩家一个回归的理由
- 7曾火爆全网的老牌武侠大变样!卸下包袱之后,如今反倒更受欢迎
- 8《天使之恋Online 国际版》今日正式上线 支持实时翻译系统
- 9《九牧之野》官方PC互通版已上线 | 多端互通礼可领400金锭
- 10腾讯大砍海外游戏投资 《艾尔登法环》开发商排除在外

