17173 > 游戏资讯 > 科技新闻 > 正文

172天,从谷底到全球第一!他拿走了中国大模型领域最大一笔融资

2026-05-14 16:36:01 神评论
17173 新闻导语

172天从谷底到全球第一!揭秘Kimi创始人杨植麟如何带领月之暗面完成136亿融资逆袭,超越GPT-5登顶AI巅峰。中国大模型最大融资背后的技术理想主义胜利。

Kimi,一个熟悉又陌生的名字

2024年,它曾是全网最火的AI工具。大学生用它读100万字的毕业论文,打工人用它整理全年的会议纪要,甚至有人把整本《红楼梦》扔进去,让它续写林黛玉和贾宝玉的结局。那段时间,你的朋友圈一定被“Kimi帮我读完了XX”刷屏过。

然而到了2025年

Kimi仿佛一夜之间人间蒸发了

这一年,AI圈发生了太多事:DeepSeek-R1横空出世,用击穿地板的价格把所有对手打懵;OpenAI发布o1,让全世界见识了什么叫“会思考的AI”;Sora2震撼登场,视频生成从此进入新纪元;无数大模型公司成立,又无数大模型公司倒闭。

《财经》杂志封面

就在所有人都以为Kimi已经凉透了,准备把它从收藏夹里删掉的时候,它突然杀了回来,而且一出手就是王炸:

2026年1月,KimiK2.5发布,在多个智能体测试集中超越GPT-5.2、Claude 4.5 Opus,登顶全球第一。

3月16日,Kmi的母公司月之暗面发布最新论文,这篇论文的核心,是对大模型中最基础、却长期被默认接受的结构之一残差连接的重新设计。这项进展很快引发海外关注,马斯克称其“令人印象深刻”。

3月18日,月之暗面的创始人杨植麟作为现场唯一中国独立大模型创始人登上英伟达GTC大会主舞台,发表题为《How We Scaled Kimi K2.5》的演讲,黄仁勋亲自为他站台。

4月,杨植麟受邀出席国务院总理主持的经济形势专家和企业家座谈会,成为全场最年轻的参会者。

5月7日,完成20亿美元(约136亿人民币)D轮融资,投后估值突破200亿美元,创下中国大模型领域单笔融资最高纪录。

世界再次聚焦于这个来自广东汕头的90后学霸——杨植麟,和他那个名字充满摇滚气息的公司:月之暗面。

摇滚少年的“月之暗面”

如果说人生有剧本,那杨植麟拿的一定是“爽文男主”。

三入清华

1993年,杨植麟出生在广东汕头澄海一个普通家庭。

小时候的他梦想不是当科学家,而是成为摇滚明星或流浪诗人,座右铭是Just for fun。他痴迷于Pink Floyd的迷幻摇滚,整天戴着耳机听《The Dark Side of The Moon》,完全没想到二十年后,这张专辑会成为他公司的名字。

专辑封面,由英国传奇设计工作室Hipgnosis的Storm Thorgerson和Aubrey Powell设计,插画由George Hardie完成

高中以前,杨植麟连电脑都很少碰。15岁进入汕头金山中学后,因为逻辑思维突出,被老师选进了信息学奥林匹克竞赛培训班。谁也没想到,这个零基础的少年,只用了一年时间就拿下了NOIP(全国青少年信息学奥林匹克联赛)广东赛区一等奖,直接获得了清华大学的保送资格。

更凡尔赛的是,他觉得保送太没意思,非要参加高考体验一下。结果考了667分,成为汕头市理科状元,又一次被清华录取。加上之前的自主招生,他被网友戏称为“三次被清华录取的男人”。

2011年,杨植麟进入清华大学热能工程系。大二那年,他看了村上春树的小说《世界尽头与冷酷仙境》,被里面“计算士”专注敲代码的场景深深吸引,毅然决定转去竞争最激烈的计算机系,师从唐杰教授。

《世界尽头与冷酷仙境》

在清华,杨植麟创造了一个至今无人打破的纪录:10门专业课满分,所有专业课成绩90分以上,年级第一毕业。

但他不是那种只会读书的书呆子,课余时间,他和后来的联合创始人周昕宇一起组建了摇滚乐队Splay——这个名字来自一种数据结构"伸展树"(SplayTree),完美融合了他的两个爱好。

乐队还写过一首原创歌曲,讲的是"创业成功一夜暴富的白日梦"。当时他们写这首歌是为了调侃圈子里那些一心想阶级跨越的人,提醒自己不要变得太功利。谁能想到,十年后,这个"白日梦"真的实现了,而且是超额实现。

两篇神作

2015年,杨植麟赴卡内基梅隆大学(CMU)攻读博士学位,师从苹果AI负责人Ruslan Salakhutdinov和谷歌首席科学家William Cohen。别人需要6年才能读完的博士,他只用了4年就毕业了。

读博期间,他发表了两篇改变NLP领域的神作:Transformer-XL和XLNet。其中XLNet在20项NLP任务中超越了当时如日中天的Google BERT,18项刷新了世界纪录。

这两篇论文至今累计引用量超过2.4万次,是谷歌、Meta等巨头构建大模型的核心参考架构,杨植麟也因此成为"中国35岁以下NLP领域引用量最高的研究者"。

博士毕业后,杨植麟先后在谷歌大脑和MetaAI研究院工作,参与了Google Gemini、Bard等项目的早期研发。近距离观察了全球顶尖AI团队的运作后,他坚定了一个想法:中国必须有自己的大模型。

月之暗面

2023年3月,ChatGPT发布四个月后,杨植麟正式创立了月之暗面(Moonshot AI)。公司名致敬他最爱的Pink Floyd专辑《The Dark Side of The Moon》,寓意“在无人看好的领域,探寻改变世界的可能性”。

公司门口立着一架白色雅马哈钢琴,琴上的黑白琴键组成了公司的logo——这是杨植麟的个人印记。就连产品名“Kimi”,也取自他的英文名。

成立仅三个月,月之暗面就完成了3亿美元天使轮融资,估值15亿美元,这在当时的AI圈引起了不小的轰动,但真正让Kimi一战成名的,是它的长上下文能力。

2024年3月,Kimi突然宣布支持20万字无损输入——这个数字是当时GPT-4Turbo的数十倍。一夜之间,全网都在测试Kimi的超级记忆力:有人上传了整本《百年孤独》,让它分析人物关系;有人扔进去几百页的法律合同,让它找出漏洞;甚至有人把自己从小到大的日记都导进去,让AI写自传。

那段时间,Kimi的服务器被挤爆了好几次。2024年11月,Kimi月活用户达到3600万。杨植麟也从一个学术圈的"大神",变成了家喻户晓的AI明星。

至暗时刻

就在所有人都以为Kimi会一路高歌猛进的时候,一场突如其来的风暴,把它从云端狠狠摔进了谷底。

2024年12月,DeepSeek-R1横空出世。它不仅推理能力超强,而且价格低得离谱——每百万tokens只要1块钱,是Kimi的1/20。整个AI圈都炸了,大家纷纷转投DeepSeek的怀抱。

Kimi的月活用户开始断崖式下跌:从3600万跌到1820万,再跌到967万,行业排名从第二直接掉到第七。雪上加霜的是,杨植麟还陷入了与前投资人朱啸虎的股权纠纷,创始人套现的传闻满天飞。

左:朱啸虎 右:杨植麟

那段时间,行业普遍认为“独立基座模型没有未来”。智谱和MiniMax纷纷转向场景落地,很多人劝杨植麟也赶紧转型,做些赚钱的to B业务。但他拒绝了,他说:

“如果你知道这不是你想要的,你就不会FOMO(害怕错过)。”

2025年2月中旬,杨植麟做出了一个改变公司命运的决定:砍掉所有营销预算,解散70%的非技术部门,把公司人数压缩到200人左右,所有资源全部聚焦于基础算法和模型能力的突破。

从那天起,这家曾经最爱刷屏的公司仿佛从地球上蒸发了。没有发布会,没有公关通稿,甚至连官方微博都停更了。外界都以为Kimi已经凉了,等着看它倒闭的笑话。

电影《至暗时刻》

绝地反击

没有人知道,在消失的172天里,月之暗面经历了什么

后来有员工回忆,那段时间公司里的灯几乎24小时亮着。工程师们吃住都在公司,每天早上第一件事就是刷新十几万个内部监控指标,任何一条曲线的异常跳动都会引起全员警觉。有人甚至会逐token检查训练数据,把产生极端梯度的token打印出来,“像审讯嫌犯一样拷问:你为什么跳得这么剧烈?”

2025年7月11日深夜

沉默被彻底打破

Kimi在没有任何预热的情况下,突然发布了K2模型。1T参数MoE架构,在代码生成和智能体自主执行任务这两个核心领域,已经达到了全球最先进水平。更令人震惊的是,它的训练成本只有OpenAI同类产品的几十分之一。

美国《自然》杂志用"又一个DeepSeek时刻"来形容K2的表现。硅谷投资人查马斯公开表示,已经把大量工作从Grok迁到了KimiK2。

这只是开始。2026年1月,KimiK2.5发布,获得了单次调用即可调度上百个智能体的Agent Swarm能力,在HLE-Full、Browse Comp等智能体测试集中,成绩超越了GPT-5.2、Claude4.5Opus以及Gemini3Pro等旗舰闭源模型。

那个曾经被全网唱衰的Kimi,回来了

把公司压成一张纸

如果说Kimi的技术突破让人惊叹,那月之暗面的公司运作机制,简直可以用“奇葩”来形容。

《人物》杂志记者曾获准在月之暗面总部待了100小时,采访了所有愿意交谈的员工,旁听了所有不涉及商业机密的会议。最后她得出一个结论:这是一家把自己折叠成二维的公司。

二维折叠

在月之暗面,你找不到任何传统公司的影子:

没有部门划分,只有五个大致的方向:算法、产品与工程、增长、战略、运营;

没有职级,没有title,所有人的名片上都只有名字和邮箱;

没有OKR,没有KPI,没有人告诉你该做什么,不该做什么;

没有中层管理,五位联合创始人直接管理所有300多名员工;

杨植麟的飞书个性签名只有四个字:直接沟通。如果你需要别人配合完成工作,方法很简单:直接走过去问。不需要审批,不需要协调会,不需要打破部门墙——因为根本就没有墙。

有个从大厂逃出来的00后员工说:“这里太奇怪了,竟然不用开会就能干活。”

当然,这种模式不是所有人都能适应。有一位曾带过近千人团队的大厂管理者加入Kimi后,发现自己只能管理两个人。至少有三位大厂中高层空降失败,其中一位最终选择离开这个行业,说“身边的人实在太年轻、太聪明了,这不再是我的时代。”

天才蜂群

月之暗面的招人方式,被称为“收容流浪的天才”。

公司里至少有50人此前创过业或加入过创业公司。他们寻找的是有“创始人式DNA”的人——那些宁愿选择1%概率拿到100分,也不要100%确定拿到60分的人。

最著名的例子,就是17岁的高中实习生陈广宇。

2026年3月,月之暗面发表了一篇震惊全球的论文《Attention Residuals》,把OpenAI联合创始人Ilya提出的设想变成了现实,马斯克亲自转发点赞。而这篇论文的共同第一作者,就是当时还在读高中的陈广宇。

陈广宇(nathan chen)是在一场中学生黑客松上被月之暗面的工程师发现的。虽然他没有任何名校背景,也没有拿过什么大奖,但他对AI的热情和天赋打动了所有人。在月之暗面,他和苏剑林(RoPE旋转位置编码的提出者,AI圈公认的"苏神")一起工作,最终成为了论文的第一作者。

苏剑林,是公司里唯一可以居家办公的员工。因为他不喜欢办公室的环境,在家工作效率更高。在月之暗面,只要你能做出成果,怎么舒服怎么来。

I人天堂

月之暗面被称为“I人公司”,据说公司里80%的员工都是内向型人格。为了照顾这些社恐的天才,杨植麟想出了各种奇招。

最有名的就是那个点菜机器人。因为大家都不想讨论"中午吃什么"这个世纪难题,也不想和外卖员说话,公司专门开发了一个机器人。员工们提前把周围的外卖分类到"难吃""一般""可以吃""好吃"等不同等级,然后由机器人随机帮大家决定中午吃什么,统一下单,统一取餐。

公司的会议室也很有特色,全部以传奇乐队命名:PinkFloyd、Radiohead、Queen、TheBeatles、Nirvana……每个会议室门口还摆着对应乐队的黑胶唱片。门口的那架白色钢琴,每到午休时总会有工程师在这里弹琴,整个公司都弥漫着一股摇滚和代码混合的独特气息。

摇滚不死🤘.jpg

品味至上

在月之暗面,最高频出现的词不是“赚钱”,也不是“增长”,而是“品味”(Taste)。虽然品味无法量化,但它渗透在公司的每一个角落。

品味体现在产品上:当其他公司把聊天窗口硬塞进命令行时,Kimi的工程师觉得那很丑。他们花了几个星期时间,重新设计了Kimi CLI,核心逻辑只有400行Python代码,“像一首短诗”。

品味还体现在命名上:内部项目都有充满诗意的名字。有个小项目叫Ensoul(赋予灵魂),他们想让沉睡的代码文件“活”过来;有个框架叫YAMAHA,其实是“Yet Another Moonshot Agent”(又一个月之暗面智能体)的缩写;最核心的底层被命名为Kosong——马来语里“空”的意思,取自“空即是色”的禅意。

品味最体现在审美上:公司里会乐器的员工比例极高。有人开玩笑说,月之暗面随时可以组建一支交响乐团。杨植麟说:“创新创业和摇滚本质上相通,都是关于创新——通过新的东西带来增量。”

一休尼…后面忘了

一个技术理想主义者

很多人说,杨植麟是中国AI界最后一个理想主义者。

在这个追求短期利益和快速变现的时代,他坚持不做to B生意,不搞场景落地,不赚快钱,一门心思扑在基础模型研发上。有人嘲笑他太天真,有人说他脱离现实,但他用自己的行动证明了:技术理想主义不是空中楼阁,而是可以改变世界的力量。

《没有理想的人不伤心》

三个决定

月之暗面成立之初,杨植麟做出了三个在当时看来极其离经叛道的决定,正是这三个决定,成就了今天的Kimi:

第一个决定:坚定做to C。当时所有大模型公司都在抢to B订单,因为来钱快,风险小。但杨植麟认为,to C产品才能获得最广泛的用户数据,才能真正打磨出通用人工智能。

第二个决定:all in长上下文。公司成立之初,他就决定将长文本无损压缩作为核心技术方向,提前布局了半年多。当时很多人认为长上下文没有商业价值,是“伪需求”。但杨植麟将长上下文比作“新的计算机内存”,认为它是实现个性化和通用世界模型的基础。

第三个决定:坚持技术理想主义。在人人喊PMF(产品市场匹配)、人人喊商业化的中国AI生态里,杨植麟不急于短期变现。他说:“AI不是我在接下来一两年找到什么PMF,而是接下来十到二十年如何改变世界。”

这三个决定,每一个都违背了当时的行业共识。但时间证明,杨植麟是对的。

三上绝壁

为了实现无损长上下文,Kimi团队经历了著名的“三上绝壁”:

第一次上绝壁:2023年5月,工程师Freddie设计了MoBAv 0.5方案,但需要在主模型训练到一半时重写底层框架,成本太高被搁置。

第二次上绝壁:半年后带着v1回来,小模型跑通了,但大模型测试时遭遇loss spike,反复失败,错过了20万字产品里程碑。

第三次上绝壁:公司发起饱和救援,调集所有技术专家集中攻关,重写核心逻辑,终于通过了"大海捞针"测试。但在监督微调阶段又遇到长文摘要表现差的问题,最终通过修改最后几层注意力机制解决。

三次退回,三次回来。这个故事完美诠释了Kimi团队的韧性。杨植麟说:“我们选择登月,不是因为它容易,而是因为它难。”

出自《原神》《去月球》和《赛博朋克:边缘行者》

终极杠杆

在2026年3月的访谈中,杨植麟首次完整提出了“AI是人类文明的终极杠杆”的理论。

他说,人类历史上有过很多杠杆:人力杠杆最多能放大几十倍,资本杠杆最多能放大几百倍,蒸汽机、电力、互联网这些技术杠杆,也只能放大人类的体力和部分脑力。但AI与所有传统杠杆都不同,它是第一个能够自我复制、自我进化、自我放大的杠杆。

AI杠杆的作用分为三个层次:

个人层面:让一个普通人拥有过去只有专家才能拥有的能力,“一个人就是一支军队”;

组织层面:彻底重构企业的组织结构和生产方式,“300人可以做过去3万人才能做的事情”;

文明层面:突破人类智力的极限,解决人类无法单独解决的问题,“推动人类文明进入下一个阶段”。

“所谓终极,不是说AI之后不会再有新的技术,而是说所有未来的技术,都将是AI的产物。AI是发明之母,它将创造出我们今天无法想象的新技术、新科学、新文明。”

出自动画《攻壳机动队》

登上雪山只是站在开端

2024年2月,杨植麟在张小珺的访谈中说:“我感觉自己就像开车在路上,前面有延绵的雪山,但你不知道里面是什么,你在一步一步往前走。”

左:杨植麟 右:张小珺

一年后,当张小珺再次问他这个问题时,他引用了英国物理学家大卫・多伊奇《无穷的开始》中的两句话:“问题是不可避免的”和“问题是可以解决的”。

大卫・多伊奇

“一年前的‘雪山’比喻依然贴切,但现在我已经看清了更多的道路。AGI不是一个明确的终点,而是一个持续向上攀登的过程。每解决一个问题,都会引出新的、更深刻的问题,而这正是技术进步的本质。我们站在无限的开端,前面的路还很长,但我们已经准备好了。”

出自动画《神之山岭》

在DeepSeek冲击最严重的时候,杨植麟把自己飞书名字的后缀加上了“时间的朋友”。他相信,技术进步是一个长期的过程,短期的波动不代表最终的结果。只要一直在正确的方向上努力,时间就会站在你这一边。

出自动画《时光代理人》

理想主义者的胜利

从2025年的至暗时刻,到2026年的王者归来,杨植麟用一年时间,完成了一场漂亮的绝地反击。

他证明了,在这个浮躁的时代,依然有人愿意为了一个遥远的理想,付出全部的努力;依然有人相信,技术的终极意义,不是为了赚钱,而是为了让人类文明变得更好。

有人问他,成功的秘诀是什么?他说:“如果所有人都觉得你正常,你的理想是大家都能想到的,它对人类的理想总量没有增量。”

是啊,正是这些"不正常"的理想主义者,在推动着世界不断前进。

杨植麟和他的月之暗面,就像Gerry O'Driscoll那句对《月之暗面》的经典评论:

There is no dark side of the moon really.

Matter of fact, it's all dark.

The only thing that makes it look light,

is the sun.

其实月球没有暗面,事实上它全是暗的

唯一让它看起来有光的,是太阳

而杨植麟,就是那个追逐太阳的人

出自《关于地球的运动》

【来源:公众号】
关于Kimi,月之暗面,杨植麟,大模型,AI,KimiK2.5,融资,智能体,Transformer-XL,XLNet的新闻
17173 首页全新改版规划中!现向各位玩家征集真实使用意见,你的想法将直接影响新版页面设计~动动手指填写问卷,快来共创你心仪的页面布局吧! 参与问卷