本文由第三方AI基于17173文章http://news.17173.com/content/07312025/142101474.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
通义Qwen3新推理模型发布:思考、数学代码能力大幅提升
2025-07-31 14:21:01
神评论
据媒体报道,阿里通义千问重磅推出推理模型升级版Qwen3-30B-A3B-Thinking-2507,在数学与代码两大核心能力上实现突破性进展。
该模型在数学推理评测AIME25中获得85.0分,在代码能力测试LiveCodeBench v6中取得66.0分,全面超越Gemini2.5-Flash(thinking)及自家前代旗舰Qwen3-235B等竞品。
新模型在知识水平评测(GPQA、MMLU-Pro)中较前代显著提升,同时在写作(WritingBench)、Agent能力(BFCL-v3)以及多轮对话、多语言指令(MultiIF)等通用能力维度均展现出优势。测试数据证实,其综合性能已形成对同类标杆模型的全面超越。
此次升级特别拓展了模型的思考长度,使其在处理高度复杂任务时具备更强潜力。开发者可通过设置更长思考时间,充分激发模型在逻辑推演、多步骤问题解决等方面的能力边界。
目前该模型已在魔搭社区和HuggingFace开源,同步上线的Qwen Chat智能对话平台将为用户提供更高效的交互体验。此次升级标志着通义千问在专用推理模型领域的技术突破,为开发者社区提供更强大的AI基础设施。
【来源:快科技】
热门测试游戏
- 1《星球大战》需要像修复前传三部曲那样修正续集
- 2两款Steam游戏创意撞车,仅一款跻身畅销榜
- 3喜欢《红色沙漠》?不妨回去重温《Skyrim》
- 4据传《塞尔达传说:时之笛 3D》Switch 2重制版将于今年圣诞节推出,全新《星际火狐大冒险》今夏登场
- 5韩国涩游《棕色尘埃2》新皮肤PV发布,尻太大外网都要打码
- 6紧身盔甲大白腿!玩家分享《红色沙漠》性感美女合集
- 7停运前夕仍推大更!MMORPG《新世界》兑现承诺,多项优化上线
- 8多模式打个痛快!曝《坦克世界:HEAT》最新地图与玩法
- 9吊带黑丝太诱人!国外美女COS《猎天使魔女》贝姐
- 10你可能不玩游戏,但你一定认识这些游戏角色!最后一个特别洗脑!



