本文由第三方AI基于17173文章http://news.17173.com/content/08052025/134206117.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
首个图像生成基础模型 阿里通义千问深夜开源Qwen-Image 支持中英双语
2025-08-05 13:42:06
神评论
今天凌晨,阿里通义千问宣布开源Qwen-Image,一个20B的MMDiT模型。
这是通义千问系列中首个图像生成基础模型,其在复杂文本渲染和精确图像编辑方面取得显著进展。
据了解,该模型专注于提升AI在两大核心场景的能力:复杂的文本渲染与精准的图像编辑。
功能亮点:
强大的文字渲染能力(本次开源)
效果领先:在多个文本测评榜单中,文字渲染均获得SOTA。
原生渲染:文字是图像生成时直出的,而非后期添加,效果更真实。
功能全面:支持中英双语,多变字体,超长段落,超小文字,并可实现复杂的多位置图文布局。
基础扎实:除了文字,模型在人物情绪、细节刻画和多样的风格渲染上也同样表现出色。
精准的图像编辑能力(即将发布)
效果稳定:多个图像编辑测评榜单SOTA。
链式编辑:在多轮连续修改后,仍能保持主体ID的一致性。
文字编辑:可以编辑图像中的文字。
复杂编辑:可编辑人物姿势,提取图像纹理等。
通义千问在多个公开基准上对Qwen-Image进行全面评估,包括用于通用图像生成的GenEval、DPG和OneIG-Bench,以及用于图像编辑的GEdit、ImgEdit和GSO。
Qwen-Image在所有基准测试中均取得了最先进的性能,展现出其在图像生成与图像编辑方面的强大能力。
此外,在用于文本渲染的LongText-Bench、ChineseWord和TextCraft上的结果表明,Qwen-Image在文本渲染方面表现尤为出色,特别是在中文文本渲染上,大幅领先现有的最先进模型。
除了文本处理,Qwen-Image在通用图像生成方面也表现出色,支持多种艺术风格。
在图像编辑方面,Qwen-Image支持风格迁移、增删改、细节增强、文字编辑,人物姿态调整等多种操作,让普通用户也能轻松实现专业级图像编辑。
【来源:快科技】
今日热点
- 《大话西游2》元宵节任务灯谜与字谜答案整理!欢迎补充
- 经典MMORPG《冒险岛M》上线PC!盘点3月外服端游
- 一看吓一跳:雷死人不偿命的囧图集(1033)
- 一看吓一跳:雷死人不偿命的囧图集(1031)
- 一看吓一跳:雷死人不偿命的囧图集(1034)
- 正惊GIF:人神共愤!如此漂亮女教师被气到动手,学生竟一脸无所谓
- 颜值COS,玉足、白丝过膝袜,体操服双马尾,简直太迷人
- 一看吓一跳:雷死人不偿命的囧图集(1035)
- 「体操服の‘液态曲线’!橘望顶配身材|白丝厚D呼之欲出,腰臀比秒杀建模」
- 2月多款重磅新游测试:腾讯网易完美新作齐发、经典韩国MMO新作
- 《蔚蓝档案》「白丝透肤VS发光腹肌!砂狼白子体操服侧拍,腰线凹陷度堪比3D建模」
- 「体操服の‘液态曲线’!橘望顶配身材|白丝厚D呼之欲出,腰臀比秒杀建模」
- 《燕云十六声》掌中宝+特殊蹊跷位置大全,三寸之身任务合集,仅剩7天10连抽连袅袅之音!
- 经典MMORPG《冒险岛M》上线PC!盘点3月外服端游
- 「纯欲天花板」2B花嫁撕破次元!白丝过膝陷肉感,透粉脚底VS发光蛮腰の双重暴击
- 《传奇5》真的要来了?还有《绝地求生》衍生作上线!盘点2026年能够玩到的韩国游戏
- 《大话西游2》元宵节任务灯谜与字谜答案整理!欢迎补充
- 和平精英2025灵敏度分享码:最稳压枪灵敏度方案推荐
- AI大姐姐:胸猛美女,挑战你的视觉极限(221)
- 《魔兽世界》时光服:附魔1-450快速性价比冲级攻略










