新游热游: 全球国内手游盘点测试表开服表怀旧频道

品牌: 游戏X博士正惊游戏公众号

新闻大全

17173 > 游戏资讯 > 科技新闻 > 正文

国产第一：阿里 Qwen3.7-Max 模型 AI 编程能力超 Claude Opus 4.6

2026-05-26 14:04:14 神评论

17173 新闻导语

阿里Qwen3.7-Max编程能力全球第二，超越Claude Opus 4.6！权威榜单Code Arena最新排名揭晓，国产AI模型实力崛起。

感谢网友取什么名、小星_14 的线索投递！

5 月 26 日消息，全球权威三方编程榜单 Code Arena 昨日（5 月 25 日）更新榜单，阿里旗舰模型 Qwen3.7-Max 得分 1541 分，仅次于 Claude 系列，在大模型厂商中排名全球第二。

查询公开资料，Code Arena 是目前全球人工智能领域含金量最高、最权威的编程大模型（LLM）能力评估榜单之一。

该榜单不测试学术化的选择题，而是评估模型在生成、调试、重构复杂代码时的实际编程能力，此外为防止刷榜（Anti-Gaming），采用用户随机盲测，模型无法提前获知考题，让模型必须具有真实的硬核代码生成能力。

根据最新榜单成绩，阿里旗舰模型 qwen3.7-max-20260517 得分 1541 分，在全球模型榜单中排名第四，仅次于 claude-opus-4-7-thinking、claude-opus-4-7 和 claude-opus-4-6-thinking。

阿里 Qwen3.7-Max 模型的编程能力已超过 claude-opus-4-6 模型，并超过了 glm-5.1、kimi-k2.6 模型。

查询公开资料，在最新放出的 Design Arena 榜单中，阿里旗舰模型 Qwen3.7-Max 同样取得耀眼成绩，位列第十名。

Design Arena (以及其图像侧 Image Arena / LMArena) 作为一个基于真实用户盲测的 AI 模型评测平台，在当前 AI 行业中具有极高的含金量。它被认为是全球公认度最高的 AI 模型评测平台之一，被称为“AI 界的奥林匹克”。

【来源：IT之家】

关于Qwen3.7-Max,Code Arena,Claude Opus,AI编程,大模型,Design Arena,阿里,编程能力,评测榜单,AI模型的新闻

今日热点

我们线下试玩了《古剑》，烛龙这次不“藏拙”了

《古剑》7月18日线下试玩《终末地》云游戏不限量测试

腾讯网易暑期大战！《遗忘之海》VS《怪物猎人》你选？

《魔兽世界》12.1奖励全解析《暗黑4》S14赛季7月1日上线

热门测试游戏

热门新闻排行

Wan网页游戏免费玩