本文由第三方AI基于17173文章http://news.17173.com/content/03202026/100706964.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
中国第一:阿里通义千问 3.5-Max-Preview 首发亮相 LM Arena 国际大模型竞技场
2026-03-20 10:07:06
神评论
17173 新闻导语
阿里通义千问3.5-Max-Preview在LM Arena国际大模型竞技场斩获1464分,全球排名第五,中国第一!揭秘其领先的数学与文本处理能力。
感谢网友 Domado、软媒用户1369491、Alita的迷弟、roloyty 的线索投递!
3 月 20 日消息,阿里千问大模型家族再迎新成员。今日,Qwen3.5-Max-Preview 作为千问 3.5 系列的旗舰模型预览版,在全球大模型竞技平台 LM Arena 正式亮相,并获得 1464 分的综合得分。
凭借这一成绩,阿里千问在 LM Arena 全球大模型公司排行榜中的排名上升至全球第五位,位列中国公司首位。

据阿里云介绍,LM Arena 是由国际开源研究机构 LMSYS 组织的第三方大模型评测平台,其评测机制采用模型两两匿名对战,由全球开发者进行盲测投票,最终根据胜负结果形成模型分数与排名。由于采用开放式对战与人工评估相结合的方式,该榜单被业界视为当前最具参考价值的大模型性能评测之一。
在本次评测中,Qwen3.5-Max-Preview 在没有风格控制(without style control)的绝对胜率比拼中,整体性能排名全球第六。在细分任务层面,该模型的数学能力排名全球第五,专家级文本处理能力排名全球第十。此次亮相也是千问 3.5 系列首次以旗舰级模型身份参与国际第三方评测。

注意到,自除夕以来,阿里千问今年已陆续开源 Qwen3.5 系列的多款模型,覆盖从 0.8B 到 397B 共 8 种不同参数规模,各尺寸模型均在同参数量级上取得领先性能。
其中,Qwen3.5-Plus 采用总参数 3970 亿、激活参数 170 亿的架构设计,以较小的激活参数实现了优于部分参数量更大模型的性能表现。此次亮相的 Qwen3.5-Max-Preview 是该系列旗舰模型的预览版本,后续将根据社区反馈持续优化迭代。
【来源:IT之家】
热门测试游戏
- 1绅士日报:国产游戏暗藏深度互动玩法,纯“浴”诱惑根本顶不住
- 2《冒险岛》23周年更新要来了!玩家可变身斗燃路西德!
- 3区块链新作《希望 M ON CROSS》已上线,跨平台无缝游玩
- 4开放玩家间自由交易?韩国MMO《星光》接入全球交易平台
- 5《红色沙漠》MMO老玩家评测:过度宣发被神化,画质战斗拉满,剧情玩法却很空洞
- 6传奇最飒女玩家:35级封神带狗,守沙三天三夜,最后却卖号隐退
- 71小时在线破20万!《红色沙漠》Steam畅销榜登顶,但国区好评仅38%
- 8《立方救赎》试玩评测:空有皮囊的半成品,难承救赎之名
- 9MMORPG《尤弥尔传奇》公开全新职业预告视频
- 10《风之国度》上线30周年:纪念插画及LOGO公开

