K-Pop女团开着机甲打怪兽，这部10分钟AI短剧把好莱坞看傻了

2026-06-05 16:07:15 神评论

17173 新闻导语

AI短剧《Zephyr》揭秘：K-Pop女团机甲打怪兽，40个镜头不崩脸！完整工作流+提示词，好莱坞都看呆。Seedance 2.0生成，角色稳定、打斗物理感、同步编舞全拆解。

一家总部设在美国的哈萨克斯坦公司，用中国字节跳动的Seedance 2.0，做了个韩国女团机甲打怪兽的片子。光是这句话，就够在AI圈炸一天的。

你是说，一家在美国的哈萨克斯坦公司用中国AI做了个韩国虚拟女团打怪兽？

这部叫《Zephyr》的科幻短剧，4月10日正式上线，全长10分多钟，一口气塞进去了五个角色、一座被怪兽围困的城市、五台定制机甲、完整的K-pop打歌舞台，还有好几场拳拳到肉的打斗戏。没有摄影机，没有布景，没有演员。全部在Higgsfield平台上用Seedance 2.0生成。上线几天，全网播放量冲到上百万，评论区里一半在问提示词，另一半在感叹：角色为什么能不崩脸。

今天wuhu就把《Zephyr》的完整工作流拆开，从角色构建到世界搭建，从打斗物理感到K-pop同步编舞，每一个环节怎么做、每一步提示词怎么写，全部摊开讲。

角色怎么做到40个镜头不崩脸

做AI视频最让人抓狂的事，你肯定经历过。生成了一个角色，爱得不行，开始写提示词跑第一个场景。到第三个场景，她已经变成了一个完全不同的人。不同的鼻子，不同的气质，连眼神都不对味了。

《Zephyr》有五个角色，40多个镜头，每个人在不同光影、不同角度、不同表情下都保持着同一张脸。导演团队用的是一套三步工作流，Tanya在幕后花絮里说得极其坦诚——一旦你看过这套流程，你就再也不会想随便乱搞了。

第一步：用Soul Cinema单独跑脸。

同一个基础提示词，反复生成多次，直到找到合适的骨骼结构、合适的眼睛、合适的气场。不是写一个prompt就完事，是真的一张一张挑。导演们把这一步叫“casting”——选角。传统电影里，选角导演要从几百份简历里挑出对的人。AI时代，换成了从几百次生成里挑出对的脸。

第二步：用Soul Cinema单独跑服装。

这是整个工作流里最有价值的反直觉操作。一般人都会把脸和衣服写进同一个提示词里一起跑。

但《Zephyr》的导演们拆开了。脸是一遍，衣服是另一遍。分开建，控制力翻倍，细节精确度翻倍。任何你特别在意的配件——一条腰带、一根绑带、一个特定的配饰——在这个阶段就要写进提示词里反复检查。如果某个细节在多次生成中消失了，就在这里把它明确地加回去，别等到拍了40个镜头才发现胸口少了个徽章。

以最年轻的成员Haru Min为例，先选脸。

提示词：年轻亚洲女性（20岁），身材纤细，极具吸引力，拥有K-POP偶像级别的美貌，肌肤无瑕，五官柔和对称，双眼富有表现力。

发型为短至中等长度，略带凌乱的时尚发型。

服装：未来主义机械机能风——短裤、层叠面料、束带、细小细节，稍有磨损感，并贴有贴纸/涂鸦。白色影棚背景，柔和电影光效，写实高端时尚风格。

再跑服装：

提示词：芥末黄乳胶短款上衣，长袖，高光光泽质感，修身。超大宽松卡其色工装裤，多个大侧袋，膝部护垫裁片，脚踝处收拢束口，腰部搭配宽搭扣腰带。焦橙色系带作战靴，厚底，中筒高度。露出腹部。街头风格结合战术实用感。鼻梁上横贴一条全息闪光创可贴。

她的服装提示词里专门写了“鼻梁上的全息闪光创可贴”。Tanya说，这是个超小的细节，但正是这个细节让她成为Haru Min，而不只是一个穿黄色上衣的女孩。细节锚定角色，泛泛的描述只会让角色漂移。

第三步：用Nano Banana Pro把脸和衣服融合成一张主资产。

把前两步跑出来的面部素材和服装素材塞进去，输出一张制作级的参考图。导演们管这张图叫“screen test”——试镜。

传统电影里，拍摄试镜是为了让摄影、灯光、美术每个部门都确切知道演员在镜头前长什么样。这张图就是AI版本的试镜。此后每一次生成，Seedance都会以它为准做校验。

这套流程跑了五次，五张主资产。演员阵容锁定。

一个废弃城市的温度

不是黑暗末日而是金色雾霭

角色有了，得给她们一个世界。导演团队需要三样东西：废弃的城市、怪兽生物、机甲。每一件都在生成任何一帧视频之前独立建完。

城市的设计有个特别刁钻的审美判断。

不是黑暗末日那种常见的废土风，而是诡异的温暖感。金色时刻的雾霭，建筑被某种东西缓慢地重新接管。不是被炸毁，是被时间吃掉。

导演团队先把概念丢给Claude，让它把情绪翻译成电影摄影语言——建筑密度怎么分布，阳光从哪个方向打过来，地面上的裂纹长什么样，空气里的尘埃密度是多少。

Claude给出的提示词不是几句模糊的氛围描述，而是整整几大段包含材质、景别、光影走向、色彩分区的摄影级语言。第一次生成的结果接近了，但被摧毁的程度不够。他们继续在瓦砾、植被蔓延和时间流逝感上加码，第二次才拿到了对的那座城。

提示词：一张高度电影化、照片级写实的实景静态画面，描绘一个广阔的废弃城市广场。完全没有任何人类存在，却充满过去生活的细微遗迹。场景通过宏大的尺度强调空旷感，同时融入具有真实感的细节，如废弃车辆与城市衰败痕迹。环境采用东亚与欧洲设计的混合建筑融合——部分坍塌的玻璃摩天大楼，带有曲面外墙、层叠阳台和密集的垂直结构，与欧洲粗野主义混凝土体块、拱形阳台和古典石材细节的残余交织在一起。没有标识、没有文字、没有象形符号——只有建筑风格的影响。这座城市感觉文化交融、全球属性模糊。广场宽阔而开放，四周高耸的摩天大楼形成峡谷般的空间。建筑形态差异极大——昔日的购物中心、住宅区、商务中心——形状与建筑风格各不相同，现已部分摧毁，有些内部结构暴露在外，另一些则结构不稳。

怪兽的建法更有意思。

不是写一个prompt跑一次就完事，而是生成多个不同变体，再把最好的几个在Nano Banana Pro里融合。

这是个值得收藏的技巧。如果你喜欢某次生成，但总觉得差点意思，就把它和另一次你喜欢的生成混在一起。你会得到单靠提示词永远无法直接生成的东西。

机甲的设计则直接绑定了每个女孩的个性。

Reina的机甲是薰衣草紫、深蓝和银色——优雅但致命。

Zero的是白色和青绿色——干净利落、不废话。

提示词：一台巨大的棱角分明的双足机甲——白色和灰色分段装甲面板，肩部和躯干带有青绿色强调板，深色炮铜色关节和液压肢体——正以充满戏剧感的广角镜头直立站立。胸部的驾驶舱是一个透明的六边形玻璃舱，可见一位女性驾驶员坐在操控台前。机甲双手各持一把半自动手枪，置于身体两侧。电影级影棚布光，近乎白色的背景，照片级真实的硬表面细节，科幻游戏概念艺术美学。摄影机围绕机甲从前到侧面缓慢环绕，景深聚焦于整个轮廓。

导演团队的意图很明确，观众看到机甲的第一眼，舱门还没打开，就该知道里面坐的是谁。这种程度的意图性，才是让AI生成物从“还不错的技术Demo”变成“真正的制作”的分水岭。

每个镜头都是导演出来的，不是跑出来的

角色有了，世界有了。接下来是整个项目里最让人兴奋的部分。怎么让AI生成的东西不是“会动的图片”，而是“有导演意图的镜头”。

导演们用了一条极其简单的规则来规划全片，每个角色被介绍两次。

一次在驾驶舱内，确立她是谁。一次在战斗中，确立她能做什么。这个结构在所有生成之前就已经定下来了，不是跑着跑着才想出来的。

先看Haru Min。她的机甲倒下了，怪兽正在逼近。而她嘴里叼着一根棒棒糖，躺在驾驶舱地板上，完全不为所动。

这个反差就是角色的全部定义。看提示词是怎么写的——它不止描述了角色的样子，还描述了摄影机如何运作。震动、重新构图、冲击后的稳定。这才是导演指令。一张酷炫的静态图和一场真正场景之间的区别，就在这几行提示词里。

Zero的介绍全在于规模。你不是先看到她本人，而是先看到机甲。

巨大的白青相间机器从废墟中跨步而出，每一步都扬起尘埃，摄影机拖曳在低角度广角上，拼命想捕捉它有多庞大。然后切到驾驶舱内部，金发、小恶魔角、淡定。导演们用同一个提示词同时覆盖了外部动作镜头和驾驶舱内的揭示。不是分两次跑，是一次跑两个场景。Seedance接住了。

Reina有个标志性的收尾镜头：她发射炮弹的瞬间，头发被后坐力猛地吹向后方，但双手始终牢牢握着银色操纵杆。这个细节是写进提示词的——不是“机甲开火”，而是“力量穿过身体”。那不是在描述一个镜头，那是在描述物理。当你写的是力对身体做了什么，模型才能理解质量、理解动量，你才能得到一个真正有感觉的重拳。

Mira的奔跑镜头也是这样。一台那个体量的机械以如此速度移动，必须感到沉重，而不是弹跳或飘浮。导演们写下了每一步踩在地面上应该产生的凹陷感。Seedance给出的结果正是如此——地面在每一步下轻微下陷，不是爆炸，不是弹跳，而是当真有如此巨大的东西经过时它应有的样子。

最难的K-pop片段，也是所有人最爱的部分。五个角色，同步化，如一而舞。

这对任何AI视频模型来说都是地狱级难度。大多数模型倾向于聚焦一个主体，然后让其他角色漂移。但导演们有两件事做对了。

第一件，音乐。他们在生成任何一帧舞蹈之前，先单独生成了完整音轨，连同歌词一起作为元素上传到Seedance里。Seedance在生成动作之前就拥有了歌曲的节拍、节奏和能量。音乐不是事后配上去的，它是生成的一部分。

第二件，他们懂得放手。整段舞蹈的提示词里没有任何“左脚迈出、手臂举起、转身”这种低级指令。就一个实际的编舞指导术语：K-pop。Seedance知道那是什么意思。它知道同步的队形能量是什么样子，身体分离的感觉是什么样，摄影机应该怎样运动。他们控制得越少，模型表现得越好。这个道理，不止适用于做视频。

回过头看《Zephyr》这套工作流，最让人感慨的不是技术参数，而是一个很朴素的道理。AI不是替你创作，是帮你把脑子里那个故事挖出来。你负责在几百次生成中找出对的那张脸，你负责在提示词里写下那根鼻梁上的创可贴，你负责决定摄影机什么时候动、什么时候停。

导演们管角色主资产叫screen test（试镜），管那根创可贴叫character anchor（角色锚点），管K-pop编舞那一招叫less is more（少即是多）。

每一句行业黑话背后，都是一次创作者对AI的驯服，而不是AI对创作者的替代。细节锚定角色，泛泛的描述只会让角色漂移。这句话，送给所有还在和AI较劲的动画人。

【来源：公众号】

关于AI短剧,Seedance 2.0,Zephyr,K-pop,机甲,怪兽,角色构建,提示词,AI视频生成,Nano Banana Pro的新闻

17173不想再闭门造车了！想请您来【QQ群：1075303978】当“骨灰级体验官”。你觉得新版丑、难用、没内味？直接骂，我们听着。新功能你先用、改版方案你投票，有效反馈还能攒积分兑换点卡/周边好礼。 一键入群

今日热点

MMO扎堆炸场！游戏黄道吉日，十余款大作狂欢

《燕云》6月26日开放新地图《逆水寒》八周年庆爆料

真送648！《逆水寒：新世界》开服，全员开荒！

被骂半年终于下手《诡秘之主》PV上线

热门测试游戏

品牌栏目

热门新闻排行

Wan网页游戏免费玩