新游热游: 全球国内手游盘点测试表开服表怀旧频道

品牌: 游戏X博士正惊游戏公众号

新闻大全

17173 > 游戏资讯 > 科技新闻 > 正文

Gemini 3中文测评结果发布：首超GPT-5 全球第二

2025-11-20 18:52:41 神评论

17173 新闻导语

谷歌Gemini 3中文测评结果发布：总分70.80，首超GPT-5，全球第二！揭秘其在幻觉控制、科学推理等维度的表现，点击查看详细对比。

2025年末全球AI竞技场再掀波澜，测评机构SuperCLUE最新报告显示：谷歌Gemini-3-Pro-Preview在SuperCLUE 9月中文大模型基准测评中获得了70.80的总分。

它超越 GPT-5(high) 1.43 分，较GPT-5.1(high)落后1.71分，位居全球第二。Gemini-2.5-Pro目前排名全球第七。

Gemini-3-Pro-Preview的推理效率相较于Gemini-2.5-Pro有些许提升，从平均每题花费32.2秒降低到31.9秒。推理成本从24.5元/百万Tokens上升到32.0元/百万Tokens。

据了解，本次测评覆盖六大核心维度，数学推理、科学推理、代码生成（含web开发）、智能体Agent（多轮工具调用）、幻觉控制、精确指令遵循。

与GPT-5.1(high)相比，Gemini-3-Pro-Preview的优势集中体现在幻觉控制，科学推理旗鼓相当，而在其他四个方面全面落败。

【来源：快科技】

关于Gemini-3-Pro-Preview,GPT-5,GPT-5.1,SuperCLUE,中文大模型,AI测评,推理效率,幻觉控制,科学推理,代码生成的新闻

今日热点

告别屠龙主线！《激战3》重磅爆料全文翻译+解析！

《古剑》41分钟实机演示首曝《终末地》云游戏不限量测试

又一款MMO端游大作来袭《永恒之塔2》国服发布会预告

《魔兽世界》国服整治公告《魔兽世界》TBC周年大更：双经典团本回归！

热门测试游戏

热门新闻排行

Wan网页游戏**玩