新游热游: 全球国内手游盘点测试表开服表怀旧频道

品牌: 游戏X博士正惊游戏公众号

新闻大全

17173 > 游戏资讯 > 科技新闻 > 正文

阿里发布HappyHorse 1.1视频生成模型：告别角色变脸、动作卡顿

2026-06-22 17:04:05 神评论

17173 新闻导语

阿里发布HappyHorse 1.1视频生成模型，五大维度升级！动态更流畅，告别角色变脸、动作卡顿，支持9张参考图保持主体一致，画质逼近实拍，音频7种语言同步，单卡H100即可输出1080P，快来体验！

6月22日消息，阿里巴巴正式推出文生视频大模型HappyHorse 1.1，这是继1.0版本后规模最大的一次全面迭代，围绕动态表现、主体还原、指令理解、画面质感、音频同步五大维度完成系统性升级，新版本已同步上线HappyHorse官网、阿里云百炼、千问云平台对外开放调用。

基础生成规格与前代保持一致，单次可输出3至15秒短片，原生支持720P、1080P两种高清分辨率，兼容任意自定义宽高比例，适配短视频、广告片、短剧分镜等多元创作场景。

动态表现力是本次核心优化方向，新版重构运动与时序建模逻辑，改善旧版动作迟缓、动态张力不足问题，舞蹈、打斗、流体、布料等复杂运动画面连贯度大幅提升，有效缓解行业普遍存在的动作失真、画面拖影缺陷。

主体一致性能力大幅增强，模型支持同时输入9张角色、商品参考图，强化多分镜、多素材融合理解。

生成全程稳定保留人物五官、品牌logo、产品细节，多人物连续镜头“角色变脸”问题显著减少，适配直播带货、系列广告、连续短剧批量生产需求。

指令遵循能力进一步强化，无论是简短关键词，还是包含多场景、多人物、镜头调度的长段叙事提示词，模型均可精准拆解执行，复杂分镜画面排布更稳定，叙事逻辑更完整。

画质质感完成精细化调校，大幅削弱AI生成常见的油光、过度锐化、虚假磨皮问题，完整保留皮肤毛孔、纹理褶皱等真实细节，人像、实景成片更贴近实拍质感，满足商业广告高清输出标准。

音频生成延续原生音画同步架构，区别于先出画面再后期配音的主流方案，文本、画面、音频统一序列建模，生成过程同步产出匹配口型的原声音频，支持中、英、日、韩、德、法、阿拉伯7种语言唇形对齐，无需二次调音对齐画面。

底层采用15B参数单流统一Transformer架构，搭配蒸馏去噪优化，推理效率与成本优势突出，单H100显卡即可快速输出1080P成片，适合中小创作者与企业批量商用生产。

【来源：快科技】

关于HappyHorse,阿里巴巴,视频生成模型,文生视频,大模型,1.1版本,动态表现,主体一致性,音频同步,15B参数的新闻

今日热点

热点预告：《古剑》开启试玩！《龙之谷》推出国风职业

《古剑》7月18日线下试玩《终末地》云游戏不限量测试

画质最强的国产MMO！被玩家骂了一整年后，如今咋样?

《魔兽世界》12.1奖励全解析《暗黑4》S14赛季7月1日上线

热门测试游戏

热门新闻排行

Wan网页游戏免费玩