本文由第三方AI基于17173文章http://news.17173.com/content/02062026/100320951.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
OpenAI 最强 AI 智能体编程模型:GPT-5.3-Codex 登场,基准测试全面霸榜
2026-02-06 10:03:20
神评论
17173 新闻导语
OpenAI发布最强AI编程模型GPT-5.3-Codex!基准测试全面霸榜,运行速度提升25%,支持实时交互编程,现已向ChatGPT付费用户开放。
感谢网友 补药吖、西窗 的线索投递!
2 月 6 日消息,OpenAI 昨日(2 月 5 日)发布公告,宣布推出 GPT-5.3-Codex,宣称这是其迄今最强的 AI 智能体编程模型。

附上相关基准测试结果如下:
在 SWE-bench Pro(公开版)测试中,该模型得分 56.8%,超越了前代的 56.4%;
在 Terminal-Bench 2.0 测试中,其得分从前代的 64.0% 大幅跃升至 77.3%;
最为显著的是在 OSWorld-Verified 智能体计算机操作基准测试中,得分从 38.2% 飙升至 64.7%,表明其在复杂环境下的操作能力实现了质的飞跃。
官方数据显示,该模型不仅在多项编程基准测试中创下新高,运行速度也比前代 GPT-5.2-Codex 提升了 25%。

OpenAI 致力于将 GPT-5.3-Codex 打造为更优秀的开发者协作工具。新模型支持用户在任务执行过程中进行“引导与交互”,且不会导致上下文丢失。
在 Codex 应用中,模型会高频更新工作进度,允许开发者实时提问、讨论方案并修正方向。官方博文指出,Codex 正从单一的编程智能体演变为更通用的计算机协作者,大幅降低了构建应用的门槛。
GPT-5.3-Codex 目前已全面向 ChatGPT 付费用户开放,涵盖 Plus、Team 及 Enterprise 等订阅计划。用户可通过 Codex 应用、命令行工具(CLI)、IDE 扩展插件及网页端立即访问,API 版本也将在近期上线。
【来源:IT之家】
热门测试游戏
- 1回忆录:人与人之间的信任呢?把号给小弟代练,没设二级密码,结果钱没了
- 2魔兽故事:比你年纪还大的彩蛋!魔兽下个终极BOSS,居然是20多年前的废案
- 3盘点近期Steam热门网游,这款腾讯网游上榜!
- 4装备强化有折扣!韩国MMO《天翼之链》韩服23周年庆
- 5《暗黑4》这赛季最大的坑,居然藏在大秘境100层之后,还好有这个方法能改回去
- 6武林掌门人也有个基建梦:国产新游今日折扣上市!
- 7百度抓虾吧禁止人类发帖 仅限AI智能体交流引争议 客服回应:后续将跟进处理
- 8突发!MOD大神模组遭N站全量下架
- 9上线不足两月即停服!《绝地求生:盲点》3月30日正式停运
- 10索尼官宣PS5全系涨价:国行Pro版涨至6299元,4月2日起生效

