Claude Opus 4.8问世：三项全球第一

2026-05-30 20:03:59 神评论

17173 新闻导语

Claude Opus 4.8发布！代码生成、幻觉控制、科学推理三项全球第一，综合智能73.93分，对开发者和科研人员极为友好，性能价格不变，点击查看详细测评。

Anthropic在5月28日推出最新旗舰大模型Claude Opus 4.8。

根据SuperCLUE最新中文测评，这款模型在代码生成、幻觉控制、科学推理三项核心能力全部拿到全球第一。

代码生成方面，Opus 4.8拿到83.58分，领先第二名超过2分，比上一代4.7版本提升4.5分以上，软件工程相关子任务同样登顶，独立写代码和网页开发都很稳。

幻觉控制得分87.48，同样全球第一，比前代提升超过6分，AI乱编答案的情况大幅减少，回答更靠谱，专业场景用起来更放心。

科学推理拿到77.19分，也是全球第一，相比4.7版本提升近9分，理科计算、逻辑推导能力明显变强。

综合智能指数73.93分，和GPT-5.5、Gemini 3.1 Pro Preview同处第一梯队。推理速度基本持平，API价格没有变化，依旧属于高性能但性价比偏低的档位。

不过它也有小幅短板，智能体任务规划、数学推理、指令遵循略有下降，指令遵循分数下滑比较明显，日常使用影响不大。

整体来看，Opus 4.8重点强化了代码、诚实度和科学推理，对开发者、科研人员非常友好，是目前综合能力最均衡的旗舰模型之一。

【来源：快科技】

关于Claude Opus 4.8,Anthropic,大模型,代码生成,幻觉控制,科学推理,旗舰模型,AI的新闻