17173 > 游戏资讯 > 科技新闻 > 正文

阿里巴巴发布视频生成模型 HappyHorse 1.1:更强动态表现力、更高生成一致性、更优视觉质感

2026-06-22 16:05:06 神评论
17173 新闻导语

阿里巴巴发布HappyHorse 1.1视频生成模型,动态表现力、主体一致性与视觉质感全面升级,支持多图参考、指令遵循及音频同步。即日起举办AI影像大赛,百万商单等你拿!

感谢网友 华南吴彦祖 的线索投递!

6 月 22 日消息,今日阿里巴巴发布视频生成模型 HappyHorse 1.1,较 1.0 版本,在动态表现力、主体一致性、指令遵循、视觉质感和音频能力等维度系统性升级。HappyHorse 官网、阿里云百炼和千问云均已接入最新版本。

在技术规格上,HappyHorse 1.1 与 1.0 版本一致,单次生成时长 3 到 15 秒,支持 720p 和 1080p 分辨率和自由宽高比。

即日起,HappyHorse 联合虎鲸文娱集团举办“Horsepower”AI 影像大赛,优胜者将获百万商单合作,由著名导演、制片人张纪中等担任评委,诚邀海内外 AIGC 创作者加入,用户可在 HappyHorse 官网报名。

附 HappyHorse 1.1 能力升级官方介绍如下:

1、动态表现力显著提升,动作更流畅,运动更有张力

通过优化运动建模与时序一致性能力,HappyHorse 1.1 进一步提升复杂动作场景下的动态质量,解决部分画面动作迟缓、节奏不足的问题,让人物、物体运动更加自然连贵,呈现更强的视觉张力与力量感。

2、主体一致性更强,多源参考融合更精准

通过强化模型对多源参考国信意的理解与融合能力,HappyHorse 1.1 的多图参考生视频 (R2V) 能力显著提升了生成视频与参考素材之间的一致性,在商品、角色、场景等复杂创作需求下,实现更精准的视觉还原。包括商品细节与品牌元素精准保持、角色与场景灵活组合并保持主体稳定、多分镜与 N 宫格参考理解增强等。

3、指令遵循升级,智能叙事编排,更懂用户输入

通过强化长上下文语义理解、场景规划能力与角色关系建模,HappyHorse 1.1 显著提升了复杂 Prompt 下的指令遵循能力与镜头编排稳定性,能够更准输地理解用户创作意图,并完成多场景、多角色的连贯演绎。无论是简短描述还是复杂叙事输入,模型都能生成更加丰富、自然且符合预期的视觉表达。

4、视觉呈现质量升级,更细腻、真实的视觉质感

通过优化人物细节生成、真实肤质还原与鏡头语言理解能力,HappyHorse 1.1 全面提升了画面质感、人物表现力与多镜头叙事连贯性。在人物表现上,模型进一步优化面部细节生成,降低过度锐化、油光感和涂抹感,让皮肤呈现更自然真实的质感;同时增强细节刻画的分寸感,在保留痘印、法令纹、毛孔等真实特征的基础上,避免细节过度放大。针对短剧、广告等高质量内容生产场景,HappyHorse 1.1 显著提升了人物特写镜头的表现力,并增强对正反打、跟拍等专业镜头语言的理解,让多镜头衔接、节奏编排与叙事表达更加自然流畅。

5、音频表达能力升级,音画同步更精准,声音细节更丰富

通过优化音频理解与生成能力,以及提升音画同步精度,HappyHorse 1.1 进一步增强了整体视听表达效果,让声音成为内容叙事的重要组成部分。生成过程中,台词表达更加自然,语速、停顿语气能够根据场景与情绪变化进行动态调整;同时提升对 Prompt 中声音描述的理解能力,让背景音乐、环境音效等声音元素更符合创作意图,减少无关音效干扰。此外,音画同步能力进一步增强,有效降低声音与画面动作、剧情节奏之间的错位,让最终作品呈现更真实、更连贯、更具沉浸感的视听体验。

【来源:IT之家】
关于HappyHorse 1.1,阿里巴巴,视频生成模型,AI,动态表现力,主体一致性,指令遵循,视觉质感,音频能力,Horsepower大赛的新闻
17173不想再闭门造车了!想请您来【QQ群:1075303978】当“骨灰级体验官”。你觉得新版丑、难用、没内味?直接骂,我们听着。新功能你先用、改版方案你投票,有效反馈还能攒积分兑换点卡/周边好礼。 一键入群