阿里发布HappyHorse 1.1视频生成模型:告别角色变脸、动作卡顿
阿里发布HappyHorse 1.1视频生成模型,五大维度升级!动态更流畅,告别角色变脸、动作卡顿,支持9张参考图保持主体一致,画质逼近实拍,音频7种语言同步,单卡H100即可输出1080P,快来体验!
6月22日消息,阿里巴巴正式推出文生视频大模型HappyHorse 1.1,这是继1.0版本后规模最大的一次全面迭代,围绕动态表现、主体还原、指令理解、画面质感、音频同步五大维度完成系统性升级,新版本已同步上线HappyHorse官网、阿里云百炼、千问云平台对外开放调用。
基础生成规格与前代保持一致,单次可输出3至15秒短片,原生支持720P、1080P两种高清分辨率,兼容任意自定义宽高比例,适配短视频、广告片、短剧分镜等多元创作场景。

动态表现力是本次核心优化方向,新版重构运动与时序建模逻辑,改善旧版动作迟缓、动态张力不足问题,舞蹈、打斗、流体、布料等复杂运动画面连贯度大幅提升,有效缓解行业普遍存在的动作失真、画面拖影缺陷。
主体一致性能力大幅增强,模型支持同时输入9张角色、商品参考图,强化多分镜、多素材融合理解。
生成全程稳定保留人物五官、品牌logo、产品细节,多人物连续镜头“角色变脸”问题显著减少,适配直播带货、系列广告、连续短剧批量生产需求。

指令遵循能力进一步强化,无论是简短关键词,还是包含多场景、多人物、镜头调度的长段叙事提示词,模型均可精准拆解执行,复杂分镜画面排布更稳定,叙事逻辑更完整。
画质质感完成精细化调校,大幅削弱AI生成常见的油光、过度锐化、虚假磨皮问题,完整保留皮肤毛孔、纹理褶皱等真实细节,人像、实景成片更贴近实拍质感,满足商业广告高清输出标准。

音频生成延续原生音画同步架构,区别于先出画面再后期配音的主流方案,文本、画面、音频统一序列建模,生成过程同步产出匹配口型的原声音频,支持中、英、日、韩、德、法、阿拉伯7种语言唇形对齐,无需二次调音对齐画面。
底层采用15B参数单流统一Transformer架构,搭配蒸馏去噪优化,推理效率与成本优势突出,单H100显卡即可快速输出1080P成片,适合中小创作者与企业批量商用生产。
- 1《激战》正版CCG全球首曝,国服率先开预约,双轴构筑玩出新花样
- 2终于来了!本月最色网游MMO《缔造者放逐之地》 实机试玩
- 3前完美 VS 前网易?《诡秘之主》两款游戏争夺唯一性,玩法有何区别?
- 46月停运游戏盘点!25年老资历都扛不住?腾讯投的项目仅活了400天?
- 5《失控进化》今日开启压力测试 定档7月9日多端同步上线
- 6《绝地求生》开发商再推新作!《Project ZETA》6月25日开启全球测试
- 7《逆水寒:新世界》养成系统迎来“纯爽局”级颠覆改革
- 8《诛仙世界》跨服自由混战来袭,坦克大加强,噩梦本彻底成历史
- 9《激战》IP三线齐发:手游、端游、卡牌,ArenaNet在下一盘什么棋?
- 10《三角洲行动》清雨毁号风波后续:涉事主播发声,称网传内容多经篡改编造

