本文由第三方AI基于17173文章http://news.17173.com/content/05302026/200359463.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
Claude Opus 4.8问世:三项全球第一
2026-05-30 20:03:59
神评论
17173 新闻导语
Claude Opus 4.8发布!代码生成、幻觉控制、科学推理三项全球第一,综合智能73.93分,对开发者和科研人员极为友好,性能价格不变,点击查看详细测评。
Anthropic在5月28日推出最新旗舰大模型Claude Opus 4.8。
根据SuperCLUE最新中文测评,这款模型在代码生成、幻觉控制、科学推理三项核心能力全部拿到全球第一。
代码生成方面,Opus 4.8拿到83.58分,领先第二名超过2分,比上一代4.7版本提升4.5分以上,软件工程相关子任务同样登顶,独立写代码和网页开发都很稳。
幻觉控制得分87.48,同样全球第一,比前代提升超过6分,AI乱编答案的情况大幅减少,回答更靠谱,专业场景用起来更放心。
科学推理拿到77.19分,也是全球第一,相比4.7版本提升近9分,理科计算、逻辑推导能力明显变强。

综合智能指数73.93分,和GPT-5.5、Gemini 3.1 Pro Preview同处第一梯队。推理速度基本持平,API价格没有变化,依旧属于高性能但性价比偏低的档位。
不过它也有小幅短板,智能体任务规划、数学推理、指令遵循略有下降,指令遵循分数下滑比较明显,日常使用影响不大。
整体来看,Opus 4.8重点强化了代码、诚实度和科学推理,对开发者、科研人员非常友好,是目前综合能力最均衡的旗舰模型之一。

【来源:快科技】
今日热点
热门测试游戏
- 1《龙之剑:觉醒》公开预告视频 首个冒险地区曝光
- 2又一款经典童年网游!《飘流幻境》复刻重置,Q版画风超高自由度
- 3最近大家都在玩什么?盘点五款近期在Steam热度霸榜的网游,两款即将上国服!
- 4《仙境传说RO》IP新作MMO美服测试将于6月4日开启
- 5《剑灵》韩服直播爆料总结,NEO巅峰服武功体系改版究竟是什么?
- 6《洛奇英雄传:反抗命运》公开全景欣赏功能和成就系统
- 7魔兽故事:魔兽最虚伪的守护者!篡改史书洗白自己,亲手玩崩英灵殿
- 8《流放之路2》国服与国际服分道扬镳?游戏就不该服务于玩家?
- 9坚持11年帮助其它玩家打高难boss!如今宣布引退:再也没人召唤我了
- 10回忆录:以为白捡一个号,结果免费当“代练”一年多,这口气实在咽不下!

