本文由第三方AI基于17173文章http://news.17173.com/content/05262026/140414718.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
国产第一:阿里 Qwen3.7-Max 模型 AI 编程能力超 Claude Opus 4.6
2026-05-26 14:04:14
神评论
17173 新闻导语
阿里Qwen3.7-Max编程能力全球第二,超越Claude Opus 4.6!权威榜单Code Arena最新排名揭晓,国产AI模型实力崛起。
感谢网友 取什么名、小星_14 的线索投递!
5 月 26 日消息,全球权威三方编程榜单 Code Arena 昨日(5 月 25 日)更新榜单,阿里旗舰模型 Qwen3.7-Max 得分 1541 分,仅次于 Claude 系列,在大模型厂商中排名全球第二。

查询公开资料,Code Arena 是目前全球人工智能领域含金量最高、最权威的编程大模型(LLM)能力评估榜单之一。
该榜单不测试学术化的选择题,而是评估模型在生成、调试、重构复杂代码时的实际编程能力,此外为防止刷榜(Anti-Gaming),采用用户随机盲测,模型无法提前获知考题,让模型必须具有真实的硬核代码生成能力。
根据最新榜单成绩,阿里旗舰模型 qwen3.7-max-20260517 得分 1541 分,在全球模型榜单中排名第四,仅次于 claude-opus-4-7-thinking、claude-opus-4-7 和 claude-opus-4-6-thinking。
阿里 Qwen3.7-Max 模型的编程能力已超过 claude-opus-4-6 模型,并超过了 glm-5.1、kimi-k2.6 模型。

查询公开资料,在最新放出的 Design Arena 榜单中,阿里旗舰模型 Qwen3.7-Max 同样取得耀眼成绩,位列第十名。


Design Arena (以及其图像侧 Image Arena / LMArena) 作为一个基于真实用户盲测的 AI 模型评测平台,在当前 AI 行业中具有极高的含金量。它被认为是全球公认度最高的 AI 模型评测平台之一,被称为“AI 界的奥林匹克”。

【来源:IT之家】
热门测试游戏
- 1腾讯新作翻车?主策划亲笔4000字回复,补偿玩家价值2000元道具
- 2《暗黑破坏神4》国服免费领!官宣延长到8月,永久畅玩
- 3人人都在用的OBS,怎么就成了外挂神器?
- 4《星际公民》众筹破10亿美元!5000美元概念飞船开卖!
- 5《冒险岛怀旧服》国际版测试魔术师断层第一,史莱姆王遭5000次讨伐!
- 6网友吐槽粉木耳涉嫌性暗示 盒马道歉:已下架 坚决反对低俗不良信息
- 7极境飞升,剑启新章!!《剑网一》经典版2026年度资料片今日重磅上线!
- 8传统MMO让人望而生畏?这款轻松武侠搞了新模式,把焦虑给过滤了!
- 9《剑侠情缘·零》一周年盛会将至,庆典活动首波剧透来啦!
- 10韩援COSER小花生新照!太大了以至于没法批判什么!

