本文由第三方AI基于17173文章http://news.17173.com/content/08072025/140301456.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
阿里通义千问发布小尺寸模型Qwen3-4B:超越GPT4.1-Nano 手机也能跑
2025-08-07 14:03:01
神评论
今日,阿里通义千问宣布发布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。
目前新模型已在魔搭社区、HuggingFace正式开源。
据介绍,在非推理领域,Qwen3-4B-Instruct-2507全面超越闭源的GPT4.1-Nano。
在推理领域,Qwen3-4B-Thinking-2507甚至可以媲美中等规模的Qwen3-30B-A3B(thinking)。
官方表示,2507版本的Qwen3-4B模型对手机等端侧硬件部署尤为友好。
以下为模型核心亮点
Qwen3-4B-Instruct-2507
通用能力均大幅提升,超越商业闭源的小尺寸模型GPT-4.1-nano,与中等规模的Qwen3-30B-A3B(non-thinking)性能接近。
新模型覆盖更多语言的长尾知识,在主观和开放性任务中增强了人类偏好对齐,可提供更符合人们需求的答复。
上下文理解扩展至256K,小模型也能处理长文本。
Qwen3-4B-Thinking-2507
推理能力大幅增强,AIME25高达81.3分,Qwen3-4B-Thinking-2507的推理表现可媲美中等模型Qwen3-30B-Thinking。
特别是在聚焦数学能力的AIME25测评中,以4B参数量斩获81.3分成绩。
Agent分数爆表,相关评测均超越更大尺寸的Qwen3-30B-Thinking模型。
256K tokens上下文的理解能力,支持更复杂的文档分析、长篇内容生成、跨段落推理等场景。

【来源:快科技】
热门测试游戏
- 1又一传奇MMORPG上线,还有全新类暗黑刷刷新作!盘点4月外服多人游戏
- 2高自由养成!韩国MMO《丝路传说Again》定档4月7日
- 3韩国女团成员撞脸《生化危机》艾达王 玩家大呼太像了
- 4成人恶搞版《超英派遣中心》在Steam上公布
- 5《洛奇英雄传》IP新作最新开发动向来了!新增多位美女NPC
- 6育碧刷宝射击新作《全境封锁:曙光》今日全球上线
- 7玩家称赞《红色沙漠》里女角色全是大雷妹!但还不够性感
- 8梦幻西游:心疼老板和主播,玩家鉴定140铠甲也追梦点专用,炸出无级别却无用
- 9《魔兽世界》12.0 下周将集体起飞!这些玩家可获取3件285装备和四件套
- 10魔兽时光服:把橙装留给土豪,这些紫装才是平民玩家的P3版本答案




