阿里巴巴发布视频生成模型 HappyHorse 1.1：更强动态表现力、更高生成一致性、更优视觉质感

2026-06-22 16:05:06 神评论

17173 新闻导语

阿里巴巴发布HappyHorse 1.1视频生成模型，动态表现力、主体一致性与视觉质感全面升级，支持多图参考、指令遵循及音频同步。即日起举办AI影像大赛，百万商单等你拿！

感谢网友华南吴彦祖的线索投递！

6 月 22 日消息，今日阿里巴巴发布视频生成模型 HappyHorse 1.1，较 1.0 版本，在动态表现力、主体一致性、指令遵循、视觉质感和音频能力等维度系统性升级。HappyHorse 官网、阿里云百炼和千问云均已接入最新版本。

在技术规格上，HappyHorse 1.1 与 1.0 版本一致，单次生成时长 3 到 15 秒，支持 720p 和 1080p 分辨率和自由宽高比。

即日起，HappyHorse 联合虎鲸文娱集团举办“Horsepower”AI 影像大赛，优胜者将获百万商单合作，由著名导演、制片人张纪中等担任评委，诚邀海内外 AIGC 创作者加入，用户可在 HappyHorse 官网报名。

附 HappyHorse 1.1 能力升级官方介绍如下：

1、动态表现力显著提升，动作更流畅，运动更有张力

通过优化运动建模与时序一致性能力，HappyHorse 1.1 进一步提升复杂动作场景下的动态质量，解决部分画面动作迟缓、节奏不足的问题，让人物、物体运动更加自然连贵，呈现更强的视觉张力与力量感。

2、主体一致性更强，多源参考融合更精准

通过强化模型对多源参考国信意的理解与融合能力，HappyHorse 1.1 的多图参考生视频 (R2V) 能力显著提升了生成视频与参考素材之间的一致性，在商品、角色、场景等复杂创作需求下，实现更精准的视觉还原。包括商品细节与品牌元素精准保持、角色与场景灵活组合并保持主体稳定、多分镜与 N 宫格参考理解增强等。

3、指令遵循升级，智能叙事编排，更懂用户输入

通过强化长上下文语义理解、场景规划能力与角色关系建模，HappyHorse 1.1 显著提升了复杂 Prompt 下的指令遵循能力与镜头编排稳定性，能够更准输地理解用户创作意图，并完成多场景、多角色的连贯演绎。无论是简短描述还是复杂叙事输入，模型都能生成更加丰富、自然且符合预期的视觉表达。

4、视觉呈现质量升级，更细腻、真实的视觉质感

通过优化人物细节生成、真实肤质还原与鏡头语言理解能力，HappyHorse 1.1 全面提升了画面质感、人物表现力与多镜头叙事连贯性。在人物表现上，模型进一步优化面部细节生成，降低过度锐化、油光感和涂抹感，让皮肤呈现更自然真实的质感；同时增强细节刻画的分寸感，在保留痘印、法令纹、毛孔等真实特征的基础上，避免细节过度放大。针对短剧、广告等高质量内容生产场景，HappyHorse 1.1 显著提升了人物特写镜头的表现力，并增强对正反打、跟拍等专业镜头语言的理解，让多镜头衔接、节奏编排与叙事表达更加自然流畅。

5、音频表达能力升级，音画同步更精准，声音细节更丰富

通过优化音频理解与生成能力，以及提升音画同步精度，HappyHorse 1.1 进一步增强了整体视听表达效果，让声音成为内容叙事的重要组成部分。生成过程中，台词表达更加自然，语速、停顿语气能够根据场景与情绪变化进行动态调整；同时提升对 Prompt 中声音描述的理解能力，让背景音乐、环境音效等声音元素更符合创作意图，减少无关音效干扰。此外，音画同步能力进一步增强，有效降低声音与画面动作、剧情节奏之间的错位，让最终作品呈现更真实、更连贯、更具沉浸感的视听体验。

【来源：IT之家】

关于HappyHorse 1.1,阿里巴巴,视频生成模型,AI,动态表现力,主体一致性,指令遵循,视觉质感,音频能力,Horsepower大赛的新闻