本文由第三方AI基于17173文章http://news.17173.com/content/05162025/175709408.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
首个毫秒级响应的实时生图大模型!腾讯混元图像2.0正式发布
2025-05-16 17:57:09
神评论
快科技5月16日消息,今天腾讯正式发布了业内首个毫秒级响应的实时生图大模型——混元图像2.0(Hunyuan Image2.0)。
目前已经在腾讯混元官方网站上线,并对外开放注册体验,该模型主要有两大特点:实时生图、超写实画质。
相比前代模型,腾讯混元图像2.0模型参数量提升了一个数量级,得益于超高压缩倍率的图像编解码器以及全新扩散架构,其生图速度显著快于行业领先模型。
在同类商业产品每张图推理速度需要5到10秒的情况下,腾讯混元可实现毫秒级响应,支持用户可以一边打字或者一边说话一边出图,改变了传统“抽卡—等待—抽卡”的方式。
除了速度快以外,腾讯混元图像2.0模型图像生成质量提升明显,通过强化学习等算法以及引入大量人类美学知识对齐,生成的图像可有效避免AIGC图像中的“AI味”,真实感强、细节丰富、可用性高。
在图像生成领域专门测试模型复杂文本指令理解与生成能力的评估基准GenEval(Geneval Bench)上,腾讯混元图像2.0模型准确率超过95%,远超其他同类模型。
腾讯表示,腾讯混元图像2.0引入多模态大语言模型(MLLM)作为文本编码器,配合自研的结构化caption系统,不仅能理解你在说什么,更能推测出你希望画面「怎么表达」。
哪怕你一句话里埋了三层含义,它也能一一拆解,再一笔一笔画出来。
除了文字输入,腾讯混元图像2.0还可以通过语音直接输入提示词,系统将语音自动转写为文字,并在识别后即时生成图像,适用于直播讲解、移动创作等场景。
也可以上传草图作为参考,模型能自动识别线稿的结构与构图逻辑,再结合提示词内容补全光影、材质、背景等细节,迅速扩展成图。
腾讯混元图像2.0模型生成的图片:
【来源:快科技】
今日热点
热门测试游戏
- 1《ARC Raiders》总监发声:呼吁行业给予失败项目更多宽容与机会
- 2《守望先锋》口碑显著回暖!Steam评价升至“褒贬不一”
- 3《英雄联盟》官方确认将上线全队语音功能:高素质玩家才能使用
- 4玩家流失超91%!索尼旗下工作室大作Steam在线仅过万
- 5385TB!全球最大经典游戏库无奈关闭 粉丝全存下来了
- 6涨价了!雷军官宣:新一代小米SU7定档3月19日
- 7里昂难逃“黑丝兔女郎”!《生化9》高能MOD现身
- 8游戏史上素质最差的玩家!被官方直接封号1000年!
- 97进4S店!林肯车主被空调冻到麻木 厂家反称:是你身体太敏感
- 10“什么?你们居然不想砍一万只野猪升级?”——魔兽任务系统诞生揭秘










