本文由第三方AI基于17173文章http://news.17173.com/content/11202025/185241549.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
Gemini 3中文测评结果发布:首超GPT-5 全球第二
2025-11-20 18:52:41
神评论
17173 新闻导语
谷歌Gemini 3中文测评结果发布:总分70.80,首超GPT-5,全球第二!揭秘其在幻觉控制、科学推理等维度的表现,点击查看详细对比。
2025年末全球AI竞技场再掀波澜,测评机构SuperCLUE最新报告显示:谷歌Gemini-3-Pro-Preview在SuperCLUE 9月中文大模型基准测评中获得了70.80的总分。
它超越 GPT-5(high) 1.43 分,较GPT-5.1(high)落后1.71分,位居全球第二。Gemini-2.5-Pro目前排名全球第七。

Gemini-3-Pro-Preview的推理效率相较于Gemini-2.5-Pro有些许提升,从平均每题花费32.2秒降低到31.9秒。推理成本从24.5元/百万Tokens上升到32.0元/百万Tokens。
据了解,本次测评覆盖六大核心维度,数学推理、科学推理、代码生成(含web开发)、智能体Agent(多轮工具调用)、幻觉控制、精确指令遵循。
与GPT-5.1(high)相比,Gemini-3-Pro-Preview的优势集中体现在幻觉控制,科学推理旗鼓相当,而在其他四个方面全面落败。

【来源:快科技】
热门测试游戏
- 1正惊GIF:有点嚣张了!颜值超绝美女两部手机太招摇,看呆旁边小伙
- 2《永劫无间》女解说被批“穿着暴露” 官方解决方案来了
- 3《Grand Theft Auto VI》开发商Rockstar证实第三方数据泄露事件中“少量非核心公司信息被访问”,黑客发出…
- 4滴滴自动驾驶 CEO 张博:十年积累,已实现 L4 级全栈核心技术的自主可控
- 5苹果部分配置 Mac mini / Mac Studio 在美国缺货,尚不明确是内存芯片短缺还是新品发布前兆
- 6明末题材新作《哀鸿》首周销量近 10 万但口碑两极分化,零创游戏嵇零致歉并承诺补救
- 7被浏览650万次的问题:有哪些很难安利的好游戏?
- 8腾讯的《王者荣耀世界》终于上线了,这游戏到底好玩吗?
- 98张地图4种玩法!《坦克世界:HEAT》内测于4月16日开启
- 10八年老厂轰然倒塌!韩国游戏公司破产,三款游戏同时停运


