本文由第三方AI基于17173文章http://news.17173.com/content/08072025/140301456.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
阿里通义千问发布小尺寸模型Qwen3-4B:超越GPT4.1-Nano 手机也能跑
2025-08-07 14:03:01
神评论
今日,阿里通义千问宣布发布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。
目前新模型已在魔搭社区、HuggingFace正式开源。
据介绍,在非推理领域,Qwen3-4B-Instruct-2507全面超越闭源的GPT4.1-Nano。
在推理领域,Qwen3-4B-Thinking-2507甚至可以媲美中等规模的Qwen3-30B-A3B(thinking)。
官方表示,2507版本的Qwen3-4B模型对手机等端侧硬件部署尤为友好。
以下为模型核心亮点
Qwen3-4B-Instruct-2507
通用能力均大幅提升,超越商业闭源的小尺寸模型GPT-4.1-nano,与中等规模的Qwen3-30B-A3B(non-thinking)性能接近。
新模型覆盖更多语言的长尾知识,在主观和开放性任务中增强了人类偏好对齐,可提供更符合人们需求的答复。
上下文理解扩展至256K,小模型也能处理长文本。
Qwen3-4B-Thinking-2507
推理能力大幅增强,AIME25高达81.3分,Qwen3-4B-Thinking-2507的推理表现可媲美中等模型Qwen3-30B-Thinking。
特别是在聚焦数学能力的AIME25测评中,以4B参数量斩获81.3分成绩。
Agent分数爆表,相关评测均超越更大尺寸的Qwen3-30B-Thinking模型。
256K tokens上下文的理解能力,支持更复杂的文档分析、长篇内容生成、跨段落推理等场景。

【来源:快科技】
热门测试游戏
- 1美艳吸血鬼来了!网石最新MMORPG《血之继承者》今日已开启预先下载!
- 22月全球手游收入榜出炉!《Last War》击败《王者荣耀》登顶
- 3梦幻西游:梦幻175在家五开,什么是最强阵容?选这个准没错效率直接拉满!
- 4新增男格斗!《地下城与勇士:起源》公开更新计划
- 5挑战可爱盗墓少女!《洛奇英雄传》3月17日开启全新战役
- 6游戏联动还能这么玩?让玩家在51区用火影跑解救外星人?
- 7魔兽世界:当玩家用脚来丈量12.0资料片,乐趣增加了10倍
- 8宝可梦公司高薪招募“现实版大木博士” 年薪最高千万日元
- 9离谱!17岁黑客只用电视棒黑入《GTA6》入狱还能玩手机
- 10《三角洲》毁号牵扯出三年前旧案 受害人合作平台深夜道歉




