本文由第三方AI基于17173文章http://news.17173.com/content/05152025/124807201.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
奥黛丽·赫本真令人倾心!阿里开源通义万相全能视频大模型
2025-05-15 12:48:07
神评论
5月14日晚,阿里巴巴正式开源通义万相Wan2.1-VACE,这是业界功能最全的视频生成与编辑模型,单一模型可同时支持文生视频、图像参考视频生成、视频重绘、视频局部编辑、视频背景延展以及视频时长延展等全系列基础生成和编辑能力。
本次共开源1.3B和14B两个版本,其中1.3B版本可在消费级显卡运行,开发者可在GitHub、Huggingface及魔搭社区下载体验。
据介绍,Wan2.1-VACE支持全部主流输入形式,涵盖文本、图像、视频、Mask和控制信号,可以实现角色一致性、布局、运动姿态和幅度等要素的控制。
例如,Wan2.1-VACE可以基于物体参考图或者视频帧生成一段视频,也可以通过抹除、局部扩展等操作,对原有视频进行重新生成,该模型还可以通过深度图、光流、布局、灰度、线稿等控制信号对视频进行编辑。

Wan2.1-VACE还支持任意基础能力的自由组合,用户无需针对特定功能训练一个新的专家模型,即可完成更复杂的任务,极大地扩展了AI视频生成的想象空间。
例如,将图片参考和主体重塑功能组合,可以实现视频的物体替换;将图片参考、首帧参考、背景扩展和时长延展功能,可以将一张竖版图片变成横版视频,并且在其中加入参考图片中的元素。
据悉,自今年2月以来,通义万相已先后开源文生视频模型、图生视频模型和首尾帧生视频模型,目前在开源社区的下载量已超330万,在GitHub上斩获超1.1w star,是同期最受欢迎的视频生成模型。

【来源:快科技】
热门测试游戏
- 1中式武学《猿公剑》试玩报告:进步巨大!属于中国川渝人的大作!
- 2正惊GIF:医患关系缓和,美女医生悉心给患者看病,小伙直接就脸红
- 327年经典MMO重生!《GODIUS》全新重置版公测开启
- 4怀旧周报:《刀剑OL》推出怀旧重铸版,奥尼尔也来砍传奇
- 5《燕云十六声》江南版本更新上线,新和鸣登场,自定义特效染色
- 6科乐美《幻想水浒传》系列新作,武术家三姐妹角色内容或将公开
- 7这恐怖的家伙又来了!在不同的游戏里面对吕布是什么体验?
- 8群雄逐鹿!未来这些国产单机,最值得期待
- 9《天堂2:盟约》金币不够用怎么办?5本紫色技能书哪里获取?
- 10骗兔耳控进来杀?借着DLC上线,我们与《TEVI》的开发组聊了聊


