17173 > 游戏资讯 > 科技新闻 > 正文

超 Claude Mythos 5 成绩:OpenAI 最强“抓虫 AI”GPT-5.5-Cyber 刷新 CyberGym 纪录

2026-06-23 16:04:28 神评论
17173 新闻导语

OpenAI发布最强“抓虫AI”GPT-5.5-Cyber,在CyberGym测试中刷新纪录,超越Claude Mythos 5,漏洞发现能力大幅提升,安全防御新突破!

6 月 23 日消息,OpenAI 公司昨日(6 月 22 日)发布公告,宣布扩展 Daybreak 网络安全项目,面向安全防御团队有限开放完整版 GPT-5.5-Cyber(网络安全专用模型)。

注:Daybreak 是 OpenAI 公司推出的网络安全计划,类似 Anthropic 推出的 Project Glasswing 项目,主要帮助防御团队发现、验证和修复漏洞,缩短漏洞进入生产环境后的处置周期。

OpenAI 在博文中指出,强大 AI 模型显著加快漏洞发现速度,目前行业的痛点和瓶颈,已转向修复这些披露的漏洞。对于软件团队而言,评估影响、编写修复代码、完成测试,并最终发布补丁,整个链条依然耗时。

模型能力方面,根据 CyberGym(网络安全评测集)的单模型成绩,GPT-5.5-Cyber 取得 85.6% 的最高成绩,刷新了 GPT 系列模型在 CyberGym 测试中的得分纪录。作为对比,GPT-5.5 模型得分为 81.8%,而 Claude Mythos 5 模型的得分为 83.8%。

在 ExploitGym 测试(考验智能体能否将已知漏洞转化为可执行的攻击代码)中,GPT-5.5-Cyber 的得分为 39.5%,而 GPT-5.5 为 25.95%。

在 SEC-bench Pro 测试中,GPT-5.5-Cyber 的得分为 69.8%,而 GPT-5.5 的得分为 63.1%。SEC-bench Pro 测试用于评估智能体在复杂软件目标上的长期漏洞发现能力和概念验证生成能力。

【来源:IT之家】
关于OpenAI,GPT-5.5-Cyber,Daybreak,网络安全,CyberGym,漏洞,Claude Mythos 5,ExploitGym,SEC-bench Pro的新闻
17173不想再闭门造车了!想请您来【QQ群:1075303978】当“骨灰级体验官”。你觉得新版丑、难用、没内味?直接骂,我们听着。新功能你先用、改版方案你投票,有效反馈还能攒积分兑换点卡/周边好礼。 一键入群