17173 > 游戏资讯 > 科技新闻 > 正文

米哈游蔡浩宇的第一颗子弹,瞄准了NPC的脸

2026-04-13 17:27:28 神评论
17173 新闻导语

米哈游蔡浩宇发布LPM 1.0 AI模型,170亿参数实现NPC实时表情与动作生成,彻底改变游戏开发。体验无限时长互动,告别固定台词时代!

那个810亿身价的男人,去年从米哈游退休时撂下一句话:AIGC会彻底改变游戏开发,普通人建议转行。

现在他自己下场做的工具,可能就是那个让一批人转行的东西。

4月9日,蔡浩宇在新加坡创立的AI公司Anuttacon在arXiv发了一篇论文,公开了视频角色表演生成模型LPM 1.0。170亿参数,主打一个功能——让虚拟角色能听、能看、能演,实时生成带表情和动作的对话视频。

LPM 1.0正式推出——这是一个基于视频的角色表演模型,能够实时说话、唱歌、倾听、回应并做出表情。支持全双工对话、身份一致的无限制长度生成,以及细腻拟人化表演。通过协同设计的数据管线、基座模型、在线模型与流式推理优化构建而成。

相较于其他视频生成模型的核心优势:表演质量、情感对话、精准唇形同步、身份保持以及生动自然的表现力。只需输入一张图片,LPM 1.0即可生成表演视频,为对话智能体、虚拟直播角色以及游戏NPC提供视觉引擎。

官方展示视频总时长有10分多钟,涵盖了非常多的角色,我选了一些表情细腻的片段。

 
已关注
关注
重播 分享
 
 
观看更多
 
 
 
 
 
 
 
 
wuhu动画人空间
 
 
 
 
 

0/0

00:00/04:33
 
 
进度条,百分之0
 
 
播放
00:00
/
04:33
04:33
倍速
全屏
 
倍速播放中
0.5倍 0.75倍 1.0倍 1.5倍 2.0倍
超清 流畅
 
 

继续观看

米哈游蔡浩宇的第一颗子弹,瞄准了NPC的脸

 
转载
,
米哈游蔡浩宇的第一颗子弹,瞄准了NPC的脸
wuhu动画人空间
已同步到看一看写下你的评论
 
 
 
 
视频详情

还有一个好玩的就是交互感升级,实时交互和NPC倾听你表达上都有很大的亮点:

倾听交互的视频效果

 
已关注
关注
重播 分享
 
 
观看更多
 
 
 
 
 
 
 
 
wuhu动画人空间
 
 
 
 
 

0/0

00:00/00:09
 
 
进度条,百分之0
 
 
播放
00:00
/
00:09
00:09
倍速
全屏
 
倍速播放中
0.5倍 0.75倍 1.0倍 1.5倍 2.0倍
超清 流畅
 
 

继续观看

米哈游蔡浩宇的第一颗子弹,瞄准了NPC的脸

 
转载
,
米哈游蔡浩宇的第一颗子弹,瞄准了NPC的脸
wuhu动画人空间
已同步到看一看写下你的评论
 
 
 
 
视频详情
实时互动的视频效果
 
已关注
关注
重播 分享
 
 
观看更多
 
 
 
 
 
 
 
 
wuhu动画人空间
 
 
 
 
 

0/0

00:00/00:07
 
 
进度条,百分之0
 
 
播放
00:00
/
00:07
00:07
倍速
全屏
 
倍速播放中
0.5倍 0.75倍 1.0倍 1.5倍 2.0倍
超清 流畅
 
 

继续观看

米哈游蔡浩宇的第一颗子弹,瞄准了NPC的脸

 
转载
,
米哈游蔡浩宇的第一颗子弹,瞄准了NPC的脸
wuhu动画人空间
已同步到看一看写下你的评论
 
 
 
 
视频详情

LPM 1.0采用多粒度身份条件控制——全局外观参考、多视角身体图像以及面部表情示例。

这种细粒度的条件控制实现了专业级的身份一致性,消除了模型在生成时“脑补”看不到的细节的需求——比如牙齿、表情纹、侧面轮廓几何以及不可见的身体外观。

 
已关注
关注
重播 分享
 
 
观看更多
 
 
 
 
 
 
 
 
wuhu动画人空间
 
 
 
 
 

0/0

00:00/00:11
 
 
进度条,百分之0
 
 
播放
00:00
/
00:11
00:11
倍速
全屏
 
倍速播放中
0.5倍 0.75倍 1.0倍 1.5倍 2.0倍
超清 流畅
 
 

继续观看

米哈游蔡浩宇的第一颗子弹,瞄准了NPC的脸

 
转载
,
米哈游蔡浩宇的第一颗子弹,瞄准了NPC的脸
wuhu动画人空间
已同步到看一看写下你的评论
 
 
 
 
视频详情

同一个角色我们再测试一下她的倾听互动效果:

 
已关注
关注
重播 分享
 
 
观看更多
 
 
 
 
 
 
 
 
wuhu动画人空间
 
 
 
 
 

0/0

00:00/00:17
 
 
进度条,百分之0
 
 
播放
00:00
/
00:17
00:17
倍速
全屏
 
倍速播放中
0.5倍 0.75倍 1.0倍 1.5倍 2.0倍
超清 流畅
 
 

继续观看

米哈游蔡浩宇的第一颗子弹,瞄准了NPC的脸

 
转载
,
米哈游蔡浩宇的第一颗子弹,瞄准了NPC的脸
wuhu动画人空间
已同步到看一看写下你的评论
 
 
 
 
视频详情

还有下一个角色的唱歌视频展示,不得不说,游戏NPC有这个体验还是很不错的:

 
已关注
关注
重播 分享
 
 
观看更多
 
 
 
 
 
 
 
 
wuhu动画人空间
 
 
 
 
 

0/0

00:00/01:19
 
 
进度条,百分之0
 
 
播放
00:00
/
01:19
01:19
倍速
全屏
 
倍速播放中
0.5倍 0.75倍 1.0倍 1.5倍 2.0倍
超清 流畅
 
 

继续观看

米哈游蔡浩宇的第一颗子弹,瞄准了NPC的脸

 
转载
,
米哈游蔡浩宇的第一颗子弹,瞄准了NPC的脸
wuhu动画人空间
已同步到看一看写下你的评论
 
 
 
 
视频详情

发布视频的AilingZeng隶属于Anuttacon技术团队,此前曾在腾讯混元团队与AI Lab实验室从事模型相关研究工作。

这不是通用视频模型。它不做Sora、Seedance2.0、HappyHorse等那种让任何画面动起来的活儿,只盯着一件事——让游戏里的NPC,终于不用再念台词了。

NPC的表演三难,有人想一巴掌拍平

做过游戏的都知道,让NPC像个人,到底有多难。

论文里提了个表演三难:高表现力、实时推理、长时稳定,三者很难同时做到。有的模型能把表情做得很真,但生成一段要等几分钟;有的跑得快,但角色说着说着就换了一张脸;还有的能稳住身份,但表情僵得像戴了面具。

LPM 1.0的解法是把问题拆细,只盯单人全双工对话场景。

翻译成人话就是——你给一张角色图,它就能根据语音或文字,实时生成这个角色在说话或倾听的视频,身份不会崩,长度可以无限续。延迟低到能接ChatGPT、豆包这类语音模型做实时对话。

Seedance2.0、HappyHorse那些模型追求的是万能,能生成任何画面,而LPM 1.0追求的是专精,只解决角色表演这一个问题。以后游戏里的NPC,不仅能跟你实时对话,还能有对应的表情和动作。你跟它说开心的事,它会笑着回应;你跟它说难过的事,它会露出心疼的表情。再也不是那个只会念固定台词的机器人。

从2025年的AI游戏《星之低语》,到2026年的LPM 1.0,蔡浩宇的布局有一条清晰的线。

 
已关注
关注
重播 分享
 
 
观看更多
 
 
 
 
 
 
 
 
wuhu动画人空间
 
 
 
 
 

0/0

00:00/01:00
 
 
进度条,百分之0
 
 
播放
00:00
/
01:00
01:00
倍速
全屏
 
倍速播放中
0.5倍 0.75倍 1.0倍 1.5倍 2.0倍
超清 流畅
 
 

继续观看

米哈游蔡浩宇的第一颗子弹,瞄准了NPC的脸

 
转载
,
米哈游蔡浩宇的第一颗子弹,瞄准了NPC的脸
wuhu动画人空间
已同步到看一看写下你的评论
 
 
 
 
视频详情

AI游戏《星之低语》

从聊天产品切入,再沉到底层模型能力,最后用AI游戏做验证。三层递进,步步为营。

Anuttacon团队里藏了不少来自腾讯混元、AI Lab的顶尖人才,这次论文的Project Lead曾爱玲就是其中之一。

他们构建了以人为中心的多模态数据集,训练了170亿参数的Base LPM,再蒸馏成低延迟的Online版本。同时推出了首个交互式角色表演基准LPM-Bench,在各项评估中拿下SOTA。

做出来给你看,但不给你用

所有报道里最扎心的信息是这句——模型仅供非商业学术使用,不会开源,不会提供API,没有任何对外服务的计划。

技术已经跑通了,但你用不到。这次对外披露的核心目的,仍是招聘。

蔡浩宇之前就说过,未来游戏开发只有两类人:要么是前0.0001%的天才精英,要么是99%的AI赋能业余爱好者。中间那层混饭吃的,可以考虑转行了。现在他自己在硅谷、新加坡疯狂组建豪华团队,用每小时最高210元人民币的薪资在全球招募AI训练师。他想要的,就是那0.0001%的人。

这种技术展示但产品封闭的策略,在游戏圈和AI圈都不少见。训练成本摆在那,170亿参数的模型,推理开销不是小团队能随便接的。

再说一个容易被忽略的硬指标:无限时长。

Kling-Avatar 2.0和OmniHuman 1.5最多只能生成30秒的视频,时间一到就得切,一切就容易断戏。为什么?因为模型要保持角色身份、表情连贯、动作自然,时间越长,累积误差就越大。脸会慢慢变形,表情会逐渐走样,最后变成另一个人。

LPM 1.0敢说无限时长输出,意味着它在时序一致性上做了根本性的架构优化。不是靠堆算力硬撑,而是模型自己学会了长期记忆。一段十分钟的对话,角色的表情、眼神、微动作能从头稳到尾,这在视频生成领域是质的飞跃。你感觉不到技术存在,那才是技术厉害的地方。

项目主页评论区有人问了句:所以《原神》里的派蒙,以后能看着我的眼睛说话了?答案可能是,但是还得等。

一个玩家的随口一问,可能比所有技术指标都更接近这场变革的本质。玩家不在乎你用了几层Transformer,不在乎蒸馏还是扩散。他只在乎,那个陪了他好几年、在屏幕上蹦蹦跳跳的小家伙,能不能在叫他名字的时候,抬头看他一眼。

这大概就是蔡浩宇说的技术宅改变世界。不是改变华尔街的K线,不是改变硅谷的估值,而是让一个像素小人,学会看着你的眼睛。

那米哈游自家的游戏能用上吗?

蔡浩宇2023年卸任米哈游CEO,但他还是米哈游的大股东,股权没动。Anuttacon是他个人在新加坡全资控股的公司,跟米哈游没有直接股权关系。两家公司独立运营,各走各的路。

目前没有任何公开信息说LPM 1.0要优先给《原神》或《崩坏:星穹铁道》用。米哈游自己的技术团队也在搞AI,没必要等着蔡浩宇喂饭。但蔡浩宇手里捏着米哈游的股份,米哈游又需要最前沿的AI技术来升级游戏体验,两家公司未来会不会有技术合作或授权协议,没人知道。

至少现阶段,Anuttacon是一家独立的技术供应商,LPM 1.0的客户可以是任何游戏公司,不绑定米哈游。

蔡浩宇已经把米哈游的摊子交给大伟哥刘伟,自己跑去硅谷二次创业。当时所有人都以为他去退休了。

但他偏不。在硅谷圣克拉拉设了办事处,成立AI公司Anuttacon,头衔是中二感爆棚的AI灵魂大法师。他正试图在2030年之前,把10亿人送进他创造的虚拟世界。

当年他从上海交大那间宿舍走出来,和两个同学靠着10万块天使投资创业。喊出一句羞耻感爆棚的口号:技术宅改变世界。2020年《原神》上线,171天狂揽10亿美元流水,米哈游估值一度冲破200亿美元。这个偏执的天才,在圈内以管理风格难搞著称,即便手下有上千人也要自己手K每一个细节。他曾放话:对我们团队来说,我觉得对的就是对的。

但这种极致的个人英雄主义,在团队膨胀到5000人时遇到了瓶颈。大型项目的沉没成本高得吓人,工业化体系让他感到压抑。对于一个相信技术宅改变世界的人来说,守着印钞机数钱,远没有去开辟新大陆刺激。

这次LPM 1.0的发布,把玩家期待值拉满,如果每个NPC都能实时表演、情感回应,游戏行业会变成什么样?

不再是玩家追着剧情跑,而是NPC主动来找你。

你路过酒馆,老板娘会抬头对你笑,说好久没来了。

你完成一个任务,队友会拍你肩膀,眼神里有崇拜也有担心。

你跟反派对话,他会眯起眼睛,嘴角微微抽搐,让你真的觉得他在算计什么。

游戏叙事从写好的剧本,变成即兴的对手戏。

玩家和角色的关系,从操控变成相处。

这不是加点表情包的小升级,是游戏设计底层的范式转换。那些只会念固定台词的NPC,以后就像默片时代的演员一样,被时代轻轻推走。

蔡浩宇的第一颗子弹,瞄准的不仅是NPC的脸,而是游戏叙事的那堵墙。 

【来源:公众号】
我想了解这个游戏:
官网 专区 下载 礼包
关于米哈游,蔡浩宇,LPM 1.0,NPC,AI游戏,视频生成模型,角色表演,实时对话,Anuttacon,游戏开发的新闻
17173 首页全新改版规划中!现向各位玩家征集真实使用意见,你的想法将直接影响新版页面设计~动动手指填写问卷,快来共创你心仪的页面布局吧! 参与问卷