谷歌宣布 Gemini 3 Deep Think 深度思考大模型升级：推进科学、研究和工程应用，可达数学、物理与化学奥赛金牌水平

2026-02-13 08:08:42 神评论

17173 新闻导语

谷歌Gemini 3 Deep Think升级，数学、物理、化学奥赛金牌水平！面向科研与工程，现已开放API早期访问。

感谢网友咩咩洋、HH_KK、袁哲YuanChe、Domado、乌蝇哥的左手的线索投递！

2 月 13 日消息，谷歌昨晚宣布对 Gemini 3 Deep Think 进行重大升级，号称是专门针对科学、研究与工程场景的开发的“推理模式”，旨在推动智能前沿发展。

据介绍，新版 Deep Think 由谷歌开发人员与各行业科学家、研究人员共同合作完成，目标是应对真实科研环境中的常见复杂问题：缺少清晰边界、未必存在唯一解，且数据往往杂乱或不完整。

此次升级的一个关键变化是，Deep Think 的可用范围进一步扩大。谷歌称，更新后的 Deep Think 从当地时间 2 月 12 日起在 Gemini 应用中向 Google AI Ultra 订阅用户开放。

注意到，谷歌首次将 Deep Think 通过 Gemini API 提供给部分研究人员、工程师与企业，采用“早期访问计划”的方式推进，并开放了申请入口以招募意向用户。

在能力表现方面，谷歌强调新版 Deep Think 在数学、算法与编程等高难推理任务上继续提升。该模式在不使用工具的情况下，在终极人类考试（Humanity's Last Exam）上取得 48.4% 的成绩；在 ARC-AGI-2 上达到 84.6%，并由 ARC Prize Foundation 验证；在 Codeforces 竞赛编程基准上获得 3455 的 Elo；并在 2025 年国际数学奥林匹克竞赛（IMO 2025）上达到金牌水平表现。

除数学与编程之外，谷歌还强调新版 Deep Think 在化学、物理等科学领域同样具备更强能力。官方称，该模式在 2025 年国际物理奥林匹克与国际化学奥林匹克的笔试部分取得金牌级结果，同时在理论物理相关的 CMT-Benchmark 上获得 50.5% 的得分。

谷歌表示，Deep Think 的目标不仅是追求基准测试成绩，还希望推动实际工程与科研应用，例如帮助研究人员解释复杂数据、帮助工程师通过代码对物理系统进行建模。谷歌称，未来将持续把 Deep Think 带到研究人员和实践者“最需要的地方”，而通过 Gemini API 开放早期访问被视为重要一步。