17173 > 游戏资讯 > 科技新闻 > 正文

阿里通义千问能力最强语言模型,Qwen3-Max 已在官网上线深度思考功能

2025-11-03 08:34:58 神评论
17173 新闻导语

阿里通义千问Qwen3-Max上线深度思考功能,万亿参数模型在AIME、HMMT推理测试中100%准确率,提升复杂任务处理效率。

阿里通义千问最新旗舰模型 Qwen3-Max 已在官网上线“深度思考”模式,该功能通过增强推理链分析与多步骤问题拆解能力,显著提升复杂任务处理效率。

IT之家注意到,阿里云于 9 月 24 日推出了 Qwen3-Max,这是通义团队迄今为止规模最大、能力最强的语言模型,参数量突破 1 万亿,预训练数据高达 36T tokens。

Qwen3-Max-Instruct 正式版在代码能力和智能体能力方面进一步提升,在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中均达到业界领先水平。

通义团队此前表示,Qwen3-Max-Thinking 在结合工具使用并增加测试时计算资源的情况下,该“思考”版本已在 AIME 25、HMMT 等高难度推理基准测试中取得 100% 的准确率。

【来源:IT之家】
关于Qwen3-Max,通义千问,深度思考,语言模型,推理能力,代码能力,智能体,基准测试,阿里云,万亿参数的新闻
17173 首页全新改版规划中!现向各位玩家征集真实使用意见,你的想法将直接影响新版页面设计~动动手指填写问卷,快来共创你心仪的页面布局吧! 参与问卷