17173 > 游戏资讯 > 科技新闻 > 正文

K-Pop女团开着机甲打怪兽,这部10分钟AI短剧把好莱坞看傻了

2026-06-05 16:07:15 神评论
17173 新闻导语

AI短剧《Zephyr》揭秘:K-Pop女团机甲打怪兽,40个镜头不崩脸!完整工作流+提示词,好莱坞都看呆。Seedance 2.0生成,角色稳定、打斗物理感、同步编舞全拆解。

一家总部设在美国的哈萨克斯坦公司,用中国字节跳动的Seedance 2.0,做了个韩国女团机甲打怪兽的片子。光是这句话,就够在AI圈炸一天的。

你是说,一家在美国的哈萨克斯坦公司用中国AI做了个韩国虚拟女团打怪兽?

这部叫《Zephyr》的科幻短剧,4月10日正式上线,全长10分多钟,一口气塞进去了五个角色、一座被怪兽围困的城市、五台定制机甲、完整的K-pop打歌舞台,还有好几场拳拳到肉的打斗戏。没有摄影机,没有布景,没有演员。全部在Higgsfield平台上用Seedance 2.0生成。上线几天,全网播放量冲到上百万,评论区里一半在问提示词,另一半在感叹:角色为什么能不崩脸。

今天wuhu就把《Zephyr》的完整工作流拆开,从角色构建到世界搭建,从打斗物理感到K-pop同步编舞,每一个环节怎么做、每一步提示词怎么写,全部摊开讲。

01

角色怎么做到40个镜头不崩脸

做AI视频最让人抓狂的事,你肯定经历过。生成了一个角色,爱得不行,开始写提示词跑第一个场景。到第三个场景,她已经变成了一个完全不同的人。不同的鼻子,不同的气质,连眼神都不对味了。

《Zephyr》有五个角色,40多个镜头,每个人在不同光影、不同角度、不同表情下都保持着同一张脸。导演团队用的是一套三步工作流,Tanya在幕后花絮里说得极其坦诚——一旦你看过这套流程,你就再也不会想随便乱搞了。

第一步:用Soul Cinema单独跑脸。

同一个基础提示词,反复生成多次,直到找到合适的骨骼结构、合适的眼睛、合适的气场。不是写一个prompt就完事,是真的一张一张挑。导演们把这一步叫“casting”——选角。传统电影里,选角导演要从几百份简历里挑出对的人。AI时代,换成了从几百次生成里挑出对的脸。

第二步:用Soul Cinema单独跑服装。

这是整个工作流里最有价值的反直觉操作。一般人都会把脸和衣服写进同一个提示词里一起跑。

但《Zephyr》的导演们拆开了。脸是一遍,衣服是另一遍。分开建,控制力翻倍,细节精确度翻倍。任何你特别在意的配件——一条腰带、一根绑带、一个特定的配饰——在这个阶段就要写进提示词里反复检查。如果某个细节在多次生成中消失了,就在这里把它明确地加回去,别等到拍了40个镜头才发现胸口少了个徽章。

以最年轻的成员Haru Min为例,先选脸。

提示词:年轻亚洲女性(20岁),身材纤细,极具吸引力,拥有K-POP偶像级别的美貌,肌肤无瑕,五官柔和对称,双眼富有表现力。

发型为短至中等长度,略带凌乱的时尚发型。

服装:未来主义机械机能风——短裤、层叠面料、束带、细小细节,稍有磨损感,并贴有贴纸/涂鸦。白色影棚背景,柔和电影光效,写实高端时尚风格。

再跑服装:

提示词:芥末黄乳胶短款上衣,长袖,高光光泽质感,修身。超大宽松卡其色工装裤,多个大侧袋,膝部护垫裁片,脚踝处收拢束口,腰部搭配宽搭扣腰带。焦橙色系带作战靴,厚底,中筒高度。露出腹部。街头风格结合战术实用感。鼻梁上横贴一条全息闪光创可贴。

她的服装提示词里专门写了“鼻梁上的全息闪光创可贴”。Tanya说,这是个超小的细节,但正是这个细节让她成为Haru Min,而不只是一个穿黄色上衣的女孩。细节锚定角色,泛泛的描述只会让角色漂移。

第三步:用Nano Banana Pro把脸和衣服融合成一张主资产。

把前两步跑出来的面部素材和服装素材塞进去,输出一张制作级的参考图。导演们管这张图叫“screen test”——试镜。

传统电影里,拍摄试镜是为了让摄影、灯光、美术每个部门都确切知道演员在镜头前长什么样。这张图就是AI版本的试镜。此后每一次生成,Seedance都会以它为准做校验。

这套流程跑了五次,五张主资产。演员阵容锁定。

02

一个废弃城市的温度

不是黑暗末日而是金色雾霭

角色有了,得给她们一个世界。导演团队需要三样东西:废弃的城市、怪兽生物、机甲。每一件都在生成任何一帧视频之前独立建完。

城市的设计有个特别刁钻的审美判断。

不是黑暗末日那种常见的废土风,而是诡异的温暖感。金色时刻的雾霭,建筑被某种东西缓慢地重新接管。不是被炸毁,是被时间吃掉。

导演团队先把概念丢给Claude,让它把情绪翻译成电影摄影语言——建筑密度怎么分布,阳光从哪个方向打过来,地面上的裂纹长什么样,空气里的尘埃密度是多少。

Claude给出的提示词不是几句模糊的氛围描述,而是整整几大段包含材质、景别、光影走向、色彩分区的摄影级语言。第一次生成的结果接近了,但被摧毁的程度不够。他们继续在瓦砾、植被蔓延和时间流逝感上加码,第二次才拿到了对的那座城。

提示词:一张高度电影化、照片级写实的实景静态画面,描绘一个广阔的废弃城市广场。完全没有任何人类存在,却充满过去生活的细微遗迹。场景通过宏大的尺度强调空旷感,同时融入具有真实感的细节,如废弃车辆与城市衰败痕迹。环境采用东亚与欧洲设计的混合建筑融合——部分坍塌的玻璃摩天大楼,带有曲面外墙、层叠阳台和密集的垂直结构,与欧洲粗野主义混凝土体块、拱形阳台和古典石材细节的残余交织在一起。没有标识、没有文字、没有象形符号——只有建筑风格的影响。这座城市感觉文化交融、全球属性模糊。广场宽阔而开放,四周高耸的摩天大楼形成峡谷般的空间。建筑形态差异极大——昔日的购物中心、住宅区、商务中心——形状与建筑风格各不相同,现已部分摧毁,有些内部结构暴露在外,另一些则结构不稳。

怪兽的建法更有意思。

不是写一个prompt跑一次就完事,而是生成多个不同变体,再把最好的几个在Nano Banana Pro里融合。

这是个值得收藏的技巧。如果你喜欢某次生成,但总觉得差点意思,就把它和另一次你喜欢的生成混在一起。你会得到单靠提示词永远无法直接生成的东西。

机甲的设计则直接绑定了每个女孩的个性。

Reina的机甲是薰衣草紫、深蓝和银色——优雅但致命。

Zero的是白色和青绿色——干净利落、不废话。

提示词:一台巨大的棱角分明的双足机甲——白色和灰色分段装甲面板,肩部和躯干带有青绿色强调板,深色炮铜色关节和液压肢体——正以充满戏剧感的广角镜头直立站立。胸部的驾驶舱是一个透明的六边形玻璃舱,可见一位女性驾驶员坐在操控台前。机甲双手各持一把半自动手枪,置于身体两侧。电影级影棚布光,近乎白色的背景,照片级真实的硬表面细节,科幻游戏概念艺术美学。摄影机围绕机甲从前到侧面缓慢环绕,景深聚焦于整个轮廓。

导演团队的意图很明确,观众看到机甲的第一眼,舱门还没打开,就该知道里面坐的是谁。这种程度的意图性,才是让AI生成物从“还不错的技术Demo”变成“真正的制作”的分水岭。

03

每个镜头都是导演出来的,不是跑出来的

角色有了,世界有了。接下来是整个项目里最让人兴奋的部分。怎么让AI生成的东西不是“会动的图片”,而是“有导演意图的镜头”。

导演们用了一条极其简单的规则来规划全片,每个角色被介绍两次。

一次在驾驶舱内,确立她是谁。一次在战斗中,确立她能做什么。这个结构在所有生成之前就已经定下来了,不是跑着跑着才想出来的。

先看Haru Min。她的机甲倒下了,怪兽正在逼近。而她嘴里叼着一根棒棒糖,躺在驾驶舱地板上,完全不为所动。

这个反差就是角色的全部定义。看提示词是怎么写的——它不止描述了角色的样子,还描述了摄影机如何运作。震动、重新构图、冲击后的稳定。这才是导演指令。一张酷炫的静态图和一场真正场景之间的区别,就在这几行提示词里。

Zero的介绍全在于规模。你不是先看到她本人,而是先看到机甲。

巨大的白青相间机器从废墟中跨步而出,每一步都扬起尘埃,摄影机拖曳在低角度广角上,拼命想捕捉它有多庞大。然后切到驾驶舱内部,金发、小恶魔角、淡定。导演们用同一个提示词同时覆盖了外部动作镜头和驾驶舱内的揭示。不是分两次跑,是一次跑两个场景。Seedance接住了。

Reina有个标志性的收尾镜头:她发射炮弹的瞬间,头发被后坐力猛地吹向后方,但双手始终牢牢握着银色操纵杆。这个细节是写进提示词的——不是“机甲开火”,而是“力量穿过身体”。那不是在描述一个镜头,那是在描述物理。当你写的是力对身体做了什么,模型才能理解质量、理解动量,你才能得到一个真正有感觉的重拳。

Mira的奔跑镜头也是这样。一台那个体量的机械以如此速度移动,必须感到沉重,而不是弹跳或飘浮。导演们写下了每一步踩在地面上应该产生的凹陷感。Seedance给出的结果正是如此——地面在每一步下轻微下陷,不是爆炸,不是弹跳,而是当真有如此巨大的东西经过时它应有的样子。

最难的K-pop片段,也是所有人最爱的部分。五个角色,同步化,如一而舞。

这对任何AI视频模型来说都是地狱级难度。大多数模型倾向于聚焦一个主体,然后让其他角色漂移。但导演们有两件事做对了。

第一件,音乐。他们在生成任何一帧舞蹈之前,先单独生成了完整音轨,连同歌词一起作为元素上传到Seedance里。Seedance在生成动作之前就拥有了歌曲的节拍、节奏和能量。音乐不是事后配上去的,它是生成的一部分。

第二件,他们懂得放手。整段舞蹈的提示词里没有任何“左脚迈出、手臂举起、转身”这种低级指令。就一个实际的编舞指导术语:K-pop。Seedance知道那是什么意思。它知道同步的队形能量是什么样子,身体分离的感觉是什么样,摄影机应该怎样运动。他们控制得越少,模型表现得越好。这个道理,不止适用于做视频。

回过头看《Zephyr》这套工作流,最让人感慨的不是技术参数,而是一个很朴素的道理。AI不是替你创作,是帮你把脑子里那个故事挖出来。你负责在几百次生成中找出对的那张脸,你负责在提示词里写下那根鼻梁上的创可贴,你负责决定摄影机什么时候动、什么时候停。

导演们管角色主资产叫screen test(试镜),管那根创可贴叫character anchor(角色锚点),管K-pop编舞那一招叫less is more(少即是多)。

每一句行业黑话背后,都是一次创作者对AI的驯服,而不是AI对创作者的替代。细节锚定角色,泛泛的描述只会让角色漂移。这句话,送给所有还在和AI较劲的动画人。

【来源:公众号】
关于AI短剧,Seedance 2.0,Zephyr,K-pop,机甲,怪兽,角色构建,提示词,AI视频生成,Nano Banana Pro的新闻
17173 首页全新改版规划中!现向各位玩家征集真实使用意见,你的想法将直接影响新版页面设计~动动手指填写问卷,快来共创你心仪的页面布局吧! 参与问卷