本文由第三方AI基于17173文章http://news.17173.com/content/11282025/234452073.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
11月中文大模型基准测评出炉:GPT 5.1夺冠、DeepSeek开源第一
2025-11-28 23:44:52
神评论
17173 新闻导语
2025年11月中文大模型基准测评结果公布!GPT-5.1以68.11分夺冠,DeepSeek-V3.2开源第一。涵盖数学推理、代码生成等5大核心任务,27个模型同台竞技。点击查看详细排名与性能分析!
SuperCLUE公布了2025年11月中文大模型基准测评结果。
本次测评围绕数学推理、科学推理、代码生成(含web开发)、幻觉控制、精确指令遵循五大核心任务展开,题目总量为822道新题,最终得分取各任务平均分。
本次共测评27个国内外大模型同台竞技,OpenAI的GPT 5.1与国产模型DeepSeek分别斩获综合冠军与开源领域第一。

OpenAI的GPT-5.1 (high) 以68.11的总分登顶,成为本月综合表现最佳的大模型。
GPT-5.1 在数学推理(74.07)、代码生成(76.30)等项表现突出,幻觉控制得分 88.80,展现出强稳定性。
Anthropic的Claude-Opus-4.5-Reasoning以62.57分紧随其后,其幻觉控制得分高达90.33,在该项能力上领跑。
而在开源模型中,深度求索的 DeepSeek-V3.2-Exp-Thinking以53.69分位列开源阵营第一。

【来源:快科技】
今日热点
- 《大话西游2》元宵节任务灯谜与字谜答案整理!欢迎补充
- 一看吓一跳:雷死人不偿命的囧图集(1033)
- 经典MMORPG《冒险岛M》上线PC!盘点3月外服端游
- 一看吓一跳:雷死人不偿命的囧图集(1035)
- 一看吓一跳:雷死人不偿命的囧图集(1034)
- 正惊GIF:人神共愤!如此漂亮女教师被气到动手,学生竟一脸无所谓
- 颜值COS,玉足、白丝过膝袜,体操服双马尾,简直太迷人
- 一看吓一跳:雷死人不偿命的囧图集(1036)
- 热游情报:宝可梦、守望、古印度黑猴新作曝光!首款二次元GTA抢先定档
- 2月多款重磅新游测试:腾讯网易完美新作齐发、经典韩国MMO新作
- 《蔚蓝档案》「白丝透肤VS发光腹肌!砂狼白子体操服侧拍,腰线凹陷度堪比3D建模」
- 「体操服の‘液态曲线’!橘望顶配身材|白丝厚D呼之欲出,腰臀比秒杀建模」
- 《燕云十六声》掌中宝+特殊蹊跷位置大全,三寸之身任务合集,仅剩7天10连抽连袅袅之音!
- 经典MMORPG《冒险岛M》上线PC!盘点3月外服端游
- 「纯欲天花板」2B花嫁撕破次元!白丝过膝陷肉感,透粉脚底VS发光蛮腰の双重暴击
- 《传奇5》真的要来了?还有《绝地求生》衍生作上线!盘点2026年能够玩到的韩国游戏
- 《大话西游2》元宵节任务灯谜与字谜答案整理!欢迎补充
- 和平精英2025灵敏度分享码:最稳压枪灵敏度方案推荐
- AI大姐姐:胸猛美女,挑战你的视觉极限(221)
- 《魔兽世界》时光服:附魔1-450快速性价比冲级攻略

