本文由第三方AI基于17173文章http://news.17173.com/content/08062025/224502462.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
国际象棋最强 AI 鸣锣开赛:首日战果公布,OpenAI 的 o3、xAI 的 Grok4 等晋级
2025-08-06 22:45:02
神评论
科技媒体 webpronews 昨日(8 月 5 日)发布博文,报道称谷歌 DeepMind 于 8 月 5~7 日在 Kaggle 的 Game Arena 平台上,举办“AI 国际象棋”比赛,邀请 OpenAI、Anthropic、谷歌、Kimi、Deepseek 在内的顶尖模型一较高下。
DeepMind 表示,本次“AI 国际象棋”比赛的目的,是检验顶级 AI 模型的推理能力。本次活动将于 8 月 5~7 日举行,每日举办一轮比赛,由国际象棋大师 Hikaru Nakamura 和流媒体播主 Levy Rozman 解说。
在 AI 发展的重要时刻,这场象棋对决提供了一个严格的测试,以评估 AI 的预见和策略调整能力,文本基础的格式解决了许多大型语言模型在视觉象棋盘表示上的难题,提供了一个更公平的推理能力测试。
附上本次参赛选手如下:
Gemini 2.5 Pro(Google)
Gemini 2.5 Flash(Google)
o3(OpenAI)
o4-mini(OpenAI)
Claude 4 Opus(Anthropic)
Grok 4(xAI)
DeepSeek R1
Kimi k2(Moonshot AI)
根据首日战况,OpenAI 的 o4 mini 胜过 Deepseek-R1、OpenAI 的 o3 超过 Kimi K2 Instruct 模型、谷歌的 Gemini 2.5 Pro 胜过 Claude Opus 4、xAI 的 Grok4 模型超过谷歌的 Gemini 2.5 Flash。
【来源:IT之家】
热门测试游戏
- 15月28日正式开测!网易《遗忘之海》最新爆料来袭:是玩法融合的野心,还是“大杂烩”的冒险?
- 2天下十八年,我们想送你一份特别的礼物
- 3看完一百张AI生成的美女图,我感觉人类文明凶多吉少了
- 4袁和平加盟《燕云十六声》任动作总顾问!蓬山、伙伴系统5月29日上线
- 510W+氪度!《燕云十六声》入坑半年!我都氪哪了?
- 6专访《逍遥江湖》老玩家亓哥:江湖十五年,是游戏,也是人生
- 7时隔多年推出新门派,《大话西游2》在520交了一份什么答卷?
- 820年老游戏还在逆生长!《梦幻西游》390万在线后再放大招
- 9《深海迷航2》发售五天销量超400万 创收超1亿美元
- 10《天国:拯救》开发商 Warhorse 官宣新作:《指环王》主题 RPG 游戏



