本文由第三方AI基于17173文章http://news.17173.com/content/06232026/160428935.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
超 Claude Mythos 5 成绩:OpenAI 最强“抓虫 AI”GPT-5.5-Cyber 刷新 CyberGym 纪录
2026-06-23 16:04:28
神评论
17173 新闻导语
OpenAI发布最强“抓虫AI”GPT-5.5-Cyber,在CyberGym测试中刷新纪录,超越Claude Mythos 5,漏洞发现能力大幅提升,安全防御新突破!
6 月 23 日消息,OpenAI 公司昨日(6 月 22 日)发布公告,宣布扩展 Daybreak 网络安全项目,面向安全防御团队有限开放完整版 GPT-5.5-Cyber(网络安全专用模型)。
注:Daybreak 是 OpenAI 公司推出的网络安全计划,类似 Anthropic 推出的 Project Glasswing 项目,主要帮助防御团队发现、验证和修复漏洞,缩短漏洞进入生产环境后的处置周期。

OpenAI 在博文中指出,强大 AI 模型显著加快漏洞发现速度,目前行业的痛点和瓶颈,已转向修复这些披露的漏洞。对于软件团队而言,评估影响、编写修复代码、完成测试,并最终发布补丁,整个链条依然耗时。
模型能力方面,根据 CyberGym(网络安全评测集)的单模型成绩,GPT-5.5-Cyber 取得 85.6% 的最高成绩,刷新了 GPT 系列模型在 CyberGym 测试中的得分纪录。作为对比,GPT-5.5 模型得分为 81.8%,而 Claude Mythos 5 模型的得分为 83.8%。

在 ExploitGym 测试(考验智能体能否将已知漏洞转化为可执行的攻击代码)中,GPT-5.5-Cyber 的得分为 39.5%,而 GPT-5.5 为 25.95%。

在 SEC-bench Pro 测试中,GPT-5.5-Cyber 的得分为 69.8%,而 GPT-5.5 的得分为 63.1%。SEC-bench Pro 测试用于评估智能体在复杂软件目标上的长期漏洞发现能力和概念验证生成能力。
【来源:IT之家】
热门测试游戏
- 1玩家用AI做了盗版《魔兽世界》经典版?网页免费玩!
- 2灵犀互娱UE5“3A 级制作”SLG《三国志》招聘信息曝光
- 3阿里游戏业务拟整体出售,估值区间曝光,巨人三七等洽谈收购
- 4NEXON 公开新《跑跑卡丁车》前导网站
- 5《天使之恋Online国际版》6月24日全球上市 今日开放预下载与角色预创建
- 6腾讯重整全球投资布局,洽谈退出日游股权,亏损也将出让股份
- 7《诡秘之主》研发细节公开,制作人为前网易《逆水寒》负责人
- 8洛奇M台服上线,龙之谷续作发售,2026年7月网游新作盘点
- 9MMORPG端游《仙境传说Zero: 全球版》公开二测日期
- 10《RO 仙境传说 3》公开 LOGO 设计理念 以世界观「时序之庭」为核心主题

