AI可能比想象中的更深入游戏行业……

2026-01-26 15:23:54 神评论
17173 新闻导语

AI如何深度参与游戏数据开发?揭秘网易、字节等大厂布局Data+AI战略,分析AI在游戏行业从数据分析到舆情治理的实际应用与挑战。

文|灰信鸽编辑|一弋

几年热潮下来,AI好像还是做不了大秘书,只能做一个小实习生。

所有问题都可以归因到一点:大模型现在还没想象中的那么聪明。

这两天聊了圈AI怎么参与游戏开发,聊到一个意料之外的方向:AI怎么参与最基础的游戏数据工作。

为什么说看到AI参与游戏数据,意料之外?因为这个领域事关两个变化。

一是AI渗透度,游戏数据+AI就像一个窗口,能观察到AI落地游戏行业的进程。

二是AI和企业的关系:AI是否不再是个人试试的小玩具,而是到了企业级,真撼动了行业多年的开发习惯。

渗透愈深,撼动越猛,意味着很多流程要变。

大家对AI做数据的许愿是什么?

AI能跟个超级秘书一样,一秒处理海量玩家数据,另一头给到产品的分析指导。

如果一个行业的地基都能接上AI,那真是自下往上地改变行业习惯。

不少人觉得游戏吃创意,这有啥用。

关键要看它在长期所能释放的人力精力和成本。

如果你身处要从零敲游戏代码的时代,也不会嘲笑第一个搭3D游戏引擎的约翰·卡马克。

盘了一圈,真不少了,做这件事的人。

最早能追溯到2017年的网易雷火伏羲,他们那时就在用AI研究用户数据,还出了好几个应用。

近一些,字节的火山引擎、之前专门做游戏行业数据的数数科技,大家在去年一起默契地推出「Data+AI」的概念。

据说投资人这两年也催得紧,要投资对象赶紧把AI落地。

但大好事肯定没那么好搞定。

一阵热度后,许愿不灵,大秘书在游戏数据这块好像没大家想象中的那么好使。

实测下来,AI做基础数据有两件事难搞。

第一,市面上的大模型仍以大语言模型为主,都是看文本的,他们处理数据没预期那么厉害。

第二,大部分模型是通用类,它们做不来太专业的东西,和黄磊做饭一样,样样通样样松。

结果是,AI上岗游戏数据,平均也就20-30%的正确率。

大家都很忙,没功夫慢慢给AI查错,错上一次两次就受不了了,不如自己上手做。

不过,AI领域有句话:每个人都想确保在浪潮来的一瞬间自己站在第一排。

意味着,AI做基础数据还有空位,就看谁能在第一时间接住。

所以大秘书做不成,大家也没开了它,先给他做小实习生做做。

做好准备,静待它脑子变聪明的那个时刻。

有必要这么早做准备吗?先说引入AI做游戏数据,能改变什么。

以前,大家做数据是从一个工具到另一个工具,找中台拉数据,塞excel拉表,拖到程序写SQL分析……

而引入AI后,变化分别体现在「工具」和「交互」。

这是一个不同于个人的,企业级变化——

所有工具,会合并到一处,打通数据,变成一个超级中台,几乎一切工作都能在这里实现。

而交互,不用写代码,甚至不用图表点拽,就像和助手对话一样跟AI说想法就好。

变化堪比七八十年代的交互革命,电脑从敲命令行的时代,一下迈入点击拖拽图标的图形时代。

关键AI做事不是黑盒,像DeepSeek思考栏一样,它一步步做什么都一清二楚,沟通纠正起来也清晰。

于是,AI的价值出来了:一个AI能衔接起所有步骤,甚至像一个大脑一样,串起整个团队的人。

这是AI带给企业的一体性。

唯一的问题在于,AI能不能识别人的意图,然后把想法执行出来。

所以大家都在做什么准备?

翻一圈总结下,现在推AI参与游戏数据,大致分两派,一派做技术,一派做应用。

技术派主张「更聪明的大脑」。

他们提升大模型质量,砸资源抢人,做研究,写paper,努力赶上全球一线的AI水平。

推出toB的应用,更像大模型向市场延展的触须,在研究之余,快速在市场找到验证场景。

像字节火山引擎背靠的Seed,以及腾讯AI Lab后面的混元,都算代表案例。

这个暂时按下不表,毕竟是和全球大模型赛跑,比科技的前沿度。技术的事,没个准数。

应用派则主张「更优质的教材」。

这一派研究AI怎么落地,既然现在大模型日新月异,赶又赶不上第一梯队,那不如做好接机准备——

这边把「怎么做游戏数据」写个指南,标准化,再做个开放接口,谁聪明就接谁,AI一进来就能直接工作。

像网易雷火伏羲的中台,以及数数科技的数据引擎,做的便是这方面工作。

用他们的话来说就是,做一个AI直通业务的桥,打通最后一公里。

不过,难点也是这最后一公里并不好接上。

有人问,AI不就做数据出身吗?这有啥难的。

问题在于,游戏数据不是坨等着被处理的excel,它是一套涵盖三部分的系统:数据开发、数据分析、数据治理。

  • 数据开发,纯技术活,可以理解为平台维护,日常是写代码,做插件之类的工作;

  • 数据分析,算研究员,平时要从数据里找到产品问题,比如能分析用户流失原因,还能提前预警;

  • 数据治理,得懂产品设计,要明白怎么收集数据,要琢磨排除数据干扰的办法。

近几年厂商在乎口碑了,所以这套系统一分为二,既指产品内的行为数据,也涵盖到产品外的舆情数据。

这是一个AI如何与人造老系统相处的问题。

数据开发还好,现在AI写程序挺麻溜的,能写能查,再不济也能写个思路给到参考。

到了数据分析,开始费时费力,也是大家花比较大力气去琢磨的模块。

就像刚才说,AI要进专业领域,得给它一个教材,教材质量关系到AI的可靠度。

现在分两种教材:一个是傻瓜版的Flow,AI跟着流程一步步做就行;一个是聪明版的Agent,教AI懂自主决策。

Flow是给AI一个严谨的工单list。游戏专家一步步做事,AI一步步学,步骤清晰,不容易出错。

不止小任务的Flow,如果好几个小Flow串一块能成大Flow,完成一个麻烦的任务链。

看着笨了点,但意味着,你可以把那些机械重复任务,丢给便宜的小模型去处理。

Agent 是教AI理解任务。AI自己找解题思路,想调什么工具也自己去找。

现在大模型还在进化,不大靠谱,所以先做个行业指南,把过去的经验做成Prompt库,做好准备。

等聪明的AI出来,接进来就不用从零费力训练,拿着指南直接干活。

现在大模型的问题是:不够聪明,随机应变不好,也不管适不适配,拿着教材硬做。

加上它做数据也没那么拿手,现阶段就是错误百出。

但等AI变聪明,不能干等。

一边等,一边得把行业经验总结成教材,做好迎接AI足够落地的时刻。

数据分析的教材准备如何,现在拼谁离业务最近,看谁能调取足够多的数据去总结经验。

别看事不大,但不同团队的结构和做事方式,直接决定了教材质量——

比如网易强调AI的实用主义,但依旧存在差别,雷火伏羲有力量做主导新研究项目,互娱AI Lab更侧重业务辅助。

再如字节的火山引擎和数数科技,前者强调通用和覆盖全行业,后者则侧重做垂类,在游戏这条线做了十年。

所以,如何准备,同样是考验人的阶段。

至于数据治理,它遇到的问题最大,说是人类从草台爬进AI时脚上戴着的桎梏,也不为过。

人为,是最大的阻碍。

不管是埋点埋哪里,还是命名叫什么,过去都是很人为的事,和写代码随便命名还不写注释一样。

人为因素越大,人都不一定看得明白,AI更费劲了。

说一个大家做AI测试真遇到过的情况:数据表格不统一。

你让AI分析上个季度三个版本的付费,结果调出来数据怎么都不对,一查发现,三个版本埋点的命名不一样。

人家AI找付费表格,结果12月的叫「Payment」,11月「Pay.11」,10月「FUFEI10」,一个都调不出来。

那所有数据管理标准化不就得了?还真不好做。

你说的付费和DAU好做标准,但国内基本都是做长线,每个版本东西都不一样,怎么标准化?

至少目前没有统一标准。

现在数据治理比较顺利的场景也有。

一个是「无菌实验」。

去年,数数科技想做AI,拉上游戏厂商做了两三周的测试,AI的准确率从20%提到88%。

但就像把无菌实验室的活搬到大院里做一样,没那么简单。

在实验环境下,数据简单,可能就这么几个版本的数据要治理,好解决。

可一搁大院里,环境变了,数据杂质多,一下就变得很不可控。

不过思路挺好:或许无菌实验室,能扩建成一个无菌大工厂呢?排除人为的脏乱差。

另一个是「单一场景」。

某上海中大厂的中台给我举过例子。

如果我手里只负责舆情的客服,加上公司项目不多,用户类型相似,那要治理的数据就简单多了。

打个比方,原本玩家反馈问题就是填个框,再上传个图片就得了。

可我要用AI参与的话,就要拉成一层层拆解的问题——

你要反馈的问题,是游戏卡死?是进度卡关?是充值失败?再往下拆三四个小选项栏,做好数据分类。

你上传的图片,是截了订单页面?还是游戏截图?这决定了AI识别图片的办法。

思路是,与其让AI直接接手复杂的人为信息,可以先让人来预处理成AI好理解的数据。

或许有别的路子,但这两个案例已经指出了,两种游戏开发如何与AI相处的逻辑。

首先你懂不懂业务?只有懂,才能一层层拆清楚业务,和AI聊处理思路,而不是一股脑地丢过去。

其次你了不了解模型?比如读截图,看个订单号大可以调小模型,分析游戏截图再用高级模型。

这关系到实用和成本两件大事。

据说,有团队打算让AI也参与到数据治理,AI给一轮梳理尝试,专家纠正一轮,如此往复,两头互勉。

如果顺利的话,AI能和项目一起搭一套治理数据的标准出来。

数据治理妥了,才能给AI搭一个够好的工作环境,后面的数据分析,乃至更上层的工作也才靠谱。

等模型,缺环境,两个问题叠一块,让AI做游戏数据一下放缓了脚步。

但不代表现在完全是等待状态,成果也是有的。

游戏数据+AI有两个概念:Data+AI,AI+Data。

Data+AI,是老流程加点AI赋赋能,属于人才引进,来点新鲜血液加活力。

刚提到数据三个模块所遇到的问题,就是典型的新老冲突,反复磨合。

AI+Data是以AI做基础,完全是AI-Native,整个流程都建立在AI上。

意思是,既然现在AI在某些地方很牛了,那与其硬凹它不擅长的地方,为什么不直接用它很牛的部分来落地呢?

相比行为数据,舆情数据就是那个能在AI-Native试水的方向。

前段时间和数数科技那边聊,他们就在做这块,而且当下效果确实比把AI用到数据分析来得实在。

舆情数据,是刚需,但不好做的需求。

市场和运营要看社区,要么靠人肉看,等平台出数据,要么只能爬出一些比较片面的关键词。

有条件的用算法搓一个系统,但项目多变,算法没那么灵活,匹配不同项目时,得各种修改算法。

那时数数也做过舆情系统,后来停了,一来难维护,二来那时候大家也不怎么看重舆情。

最近市场慢慢重视起社区反馈,他们重启舆情,但没用老一套,而是完全在AI上重做了一个。

LLM大语言模型和舆情完全是两口子,本来社区都是文本数据,舆情要的分析也只需大致归纳和呈现。

而且LLM比传统算法灵活太多,能看懂黑话,懂口语表达,不会卡死在某个关键词。

你可以理解为,舆情系统之前很难成立,但靠AI获成了真能落地且被实用的项目。

这个选择,是与其在老路拥抱AI,不如先跟着AI走新路。

谁也不知道AI的第一波浪潮什么时候会袭来游戏行业。

但敏锐的人都在做着准备。

保持敏感度,是数数那边现在的策略,据说现在公司要求所有员工都要用上AI,要熟悉和AI的对话方式。

连和数据比较远的市场岗,也建议了每个月要消耗的Token数量,不管用啥都好,至少得让AI参与进来。

深度参与业务,是网易做AI的策略,雷火和互娱两个工作室都深度参与到各自事业群的项目里面。

除了自己研究paper外,不少研究人员得像项目组成员一样,跟着项目跑。

每一个人都不能掉队,但这股浪潮也需要每一个人都做好准备,一起向前推。

AI参与基建,做底层的游戏数据,可能不是最性感的AI用法,听起来就不够高大上。

但就像朴实地拿出高性能、低价格算力Rubin平台的黄仁勋一样。

朴实无华的自下而上变革,或许才是迎接改革最有力的准备。

【来源:公众号】
关于AI,游戏数据,大模型,数据分析,数据治理,Data+AI,舆情数据,游戏开发,企业级应用,网易雷火伏羲的新闻

你不知道点进去会是什么