本文由第三方AI基于17173文章http://news.17173.com/content/07312025/142101474.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
通义Qwen3新推理模型发布:思考、数学代码能力大幅提升
2025-07-31 14:21:01
神评论
据媒体报道,阿里通义千问重磅推出推理模型升级版Qwen3-30B-A3B-Thinking-2507,在数学与代码两大核心能力上实现突破性进展。
该模型在数学推理评测AIME25中获得85.0分,在代码能力测试LiveCodeBench v6中取得66.0分,全面超越Gemini2.5-Flash(thinking)及自家前代旗舰Qwen3-235B等竞品。
新模型在知识水平评测(GPQA、MMLU-Pro)中较前代显著提升,同时在写作(WritingBench)、Agent能力(BFCL-v3)以及多轮对话、多语言指令(MultiIF)等通用能力维度均展现出优势。测试数据证实,其综合性能已形成对同类标杆模型的全面超越。
此次升级特别拓展了模型的思考长度,使其在处理高度复杂任务时具备更强潜力。开发者可通过设置更长思考时间,充分激发模型在逻辑推演、多步骤问题解决等方面的能力边界。
目前该模型已在魔搭社区和HuggingFace开源,同步上线的Qwen Chat智能对话平台将为用户提供更高效的交互体验。此次升级标志着通义千问在专用推理模型领域的技术突破,为开发者社区提供更强大的AI基础设施。
【来源:快科技】
今日热点
热门测试游戏
- 1除了《古剑》还有大招?烛龙“盗墓”题材新作《吉时已到》首曝
- 2网石经典端游IP新作MMO《RF Online Next》全球服预约开启
- 3时隔6年再开新服!韩国武侠MMO《热血江湖》推出全新职业
- 4《明末:渊虚之羽》IP已被出售 505母公司花3200万元购买
- 5网游时光机:从百万玩家在线到逐渐凉凉,《劲舞团》到底经历了什么?
- 6备战《暗黑4》S13赛季!一些顶尖玩家的经典技巧!
- 7《暗黑4》凭什么游戏倒退十年却更值得入手了?国服本体免费领!
- 8怀旧周报:魔兽国服专属活动又让老外眼馋了,《失落的方舟》制作人新作进军开放世界
- 9《龙之谷怀旧服》5月末版本爆料!70级资料片即将重磅登场!
- 10白嫖时间到!《超级马里奥银河大电影》将上线流媒体



