OpenAI刚打赢官司,联合创始人却投奔了死对头
OpenAI胜诉马斯克后,创始成员卡帕西转投死对头Anthropic!揭秘AI大神降级加入预训练团队的深层原因,硅谷人才争夺战白热化。
硅谷最近这出戏,比任何一部商战剧都精彩。
5月18日,加州法院一记落槌,马斯克那桩1500亿美元的世纪诉讼被判“告晚了”,OpenAI赢了。(一张日历,杀死了马斯克的世纪诉讼!)

Altman还没来得及庆祝,不到24小时,一记闷棍就砸了下来。
OpenAI的11位创始成员之一、前特斯拉AI总监、全球AI圈公认的“卡神”——Andrej Karpathy,在X上发了条简短帖子:“我已加入Anthropic。”

注意,不是回OpenAI,是去Anthropic。那个由OpenAI前研究副总裁Dario Amodei带队出走创立、如今估值反超OpenAI的死对头。
这就好比一支刚拿了总冠军的球队,队史功勋球员转头宣布加盟同城死敌。


而且,他去的不是什么高级副总裁或首席科学家,而是预训练团队——向一位比他年轻的项目负责人汇报,在职级上足足降了两级。
消息一出,整个硅谷都在问:为什么?
他不是一般的AI大神
先把Karpathy这个名字对圈内人的分量讲清楚。

▲ Andrej Karpathy
1986年出生在斯洛伐克,15岁移民加拿大。在多伦多大学读本科时,他选修了深度学习的教父级人物Geoffrey Hinton的课,是最早被神经网络点燃的年轻研究者之一。之后去了斯坦福,师从李飞飞,博士期间一手创建了CS231n——那门被全球无数AI从业者奉为“启蒙圣经”的卷积神经网络课程。至今,这门课的视频播放量已超过80万次。
2015年博士毕业,他成为OpenAI的创始研究科学家,是11人初始团队中最年轻的那一个。那时的OpenAI还不是今天这个估值近万亿的超级公司,而是一群理想主义者聚在一起,相信通用人工智能会改变世界。
两年后,马斯克亲自挖他去了特斯拉,执掌AI和自动驾驶视觉团队。
接下来五年里,Karpathy一手搭建了特斯拉Autopilot的纯视觉神经网络方案,并主导了从数据标注、模型训练到车载芯片部署的完整闭环。用他的前老板马斯克的话说:“论计算机视觉的实力,他堪称全球第二。”
在特斯拉,他把神经网络从论文推到了数百万辆量产车上,完整经历过AI怎么在实业里摔打——这在大多数AI研究者身上是极其稀缺的。
2023年ChatGPT爆火后,他短暂回归OpenAI,参与GPT-4的改进工作,后来离职创办AI教育公司Eureka Labs。再之后,就是5月19日那条三句话的官宣。
但让Karpathy真正封神的,远不止这份技术履历。他是极少数能同时搞研究、做工程、带产品,还能用一个词重新定义整个行业对话方式的人。
他在2017年提出“Software 2.0”——传统软件是人写代码、机器执行,而深度学习时代的程序将逐渐被数据和神经网络训练出来的模型权重取代。
这个说法后来成为整个行业理解神经网络与软件工程关系的基础框架。
2025年初,他又发明了“Vibe Coding”——开发者不再逐行控制代码,而是通过意图和对话来驱动AI生成程序。
这个词一度成为全球开发者社区最火的梗,甚至被写进维基百科。而到了2026年,他又按下升级键,提出“Agentic Engineering”(智能体工程),从“碰运气”的vibe coding阶段,跃迁到由智能体自主完成底层逻辑生成与测试修复的专业工程范式。
这就是Karpathy最稀缺的地方。他不是那种只会埋头写论文的研究者,也不是只会站在台上讲趋势的布道者,更不是只会带团队做产品的管理者。他是三者的合体,而他每一次给技术时代的“命名”,都在某种程度上重新定义了那个时代。
他去做的,是AI圈最不敢碰的赌局。
如果说Karpathy跳槽到Anthropic本身就够让人吃惊了,那他选择去做什么,才是这个故事里最重要的一笔。
他进的是Anthropic的预训练团队。不是最近两年所有人都在抢着做的Agent,不是RL post-training,不是后训练,是预训练——那个决定大模型能力上限、烧钱最猛、最近两年被整个行业疯狂唱衰的预训练。
这里需要解释一下背景。
从2024年下半年开始,AI圈逐渐形成了一个“共识”:预训练正在撞墙。所谓“Scaling Law的边际效应正在递减”——过去模型大一倍,能力上一个台阶;现在模型大几倍,效果提升可能不到10%。
OpenAI并担任首席科学家Ilya Sutskever公开说过“我们认识的那种预训练时代正在结束”,The Information把它做成封面文章,NeurIPS的走廊里全是这个论调。资本的注意力和人才储备都在往后训练方向跑,整个行业几乎已经把预训练当成了昨天的故事。
Karpathy偏偏在所有人都往外跑的时候,孤身闯进了预训练。
他不是不知道这个赌注有多重。他在X上写得很清楚:“我认为未来几年大语言模型的前沿发展将极具塑造性。”用“塑造性”这个词,说明他看到的不仅是挑战,更是一块还没被充分开发的技术空地。
更关键的是他具体要做什么。Anthropic预训练团队负责人Nick Joseph向TechCrunch确认:“Karpathy将组建一支新团队,专门用Claude来加速预训练研究。”翻译一下:他要用AI来辅助研发AI本身。这在AI安全领域有一个流传已久的专业名称——“递归自我改进”(Recursive Self-Improvement, RSI)。

▲ Nick Joseph是人工智能领域的顶尖工程师与研究员,现任AI巨头Anthropic的预训练(Pre-training)负责人兼创始团队成员。他以主导构建了Claude系列大语言模型的底层核心训练而闻名,也是Anthropic业界知名的“负责任扩展政策”(Responsible Scaling Policy, RSP)的主要倡导者与架构师之一。
这不是科幻。
Anthropic联合创始人Jack Clark在5月4日发布了一篇深度分析,花了几周时间阅读数百份公开数据后得出结论:到2028年底,AI实现递归自我改进的概率约为60%。他的论据来自一组可量化的技术指标:内部测试中,模型优化小型语言模型训练实现的加速倍数从2025年5月Opus 4的2.9倍,飙升到2026年4月Claude Mythos Preview的52倍——而人类研究员在同一任务上做到4倍加速需要4到8小时。
与此同时,Meta FAIR前研究总监田渊栋也在同月官宣成立新公司Recursive Superintelligence,方向同样是递归自我改进。当算力、数据和模型能力同步跨过临界点,递归自我改进正在从学术思想实验变成真实的工程项目。
所以,Karpathy不是去一个被唱衰的赛道当救世主,他是去一个即将爆发的火山口抢位置。
Karpathy的这次跳槽,放在更长的名单里,分量完全不同。
过去两年,OpenAI的高层人才正在出现持续的“定向流动”:2024年5月,OpenAI原超级对齐负责人Jan Leike加入Anthropic,离职时公开表示“安全文化和流程已经让位于更亮眼的产品”;同年8月,联合创始人John Schulman——PPO算法的共同发明者、ChatGPT对话能力的缔造者——加入Anthropic;10月,另一位联合创始人、算法科学家Durk Kingma也加入了同一阵营。今年5月,Karpathy加入后,他在X上特意提到:“和一群熟悉的老面孔又见面了。”
这几个名字放在一起,足以说明一个趋势——OpenAI正在变成一家更复杂的平台型、产品型和商业化公司,而Anthropic在外界叙事中更强调模型研究、安全研究与基础能力推进。这并不是说谁对谁错,只是两种路线正在加速分化。
而对Karpathy这样明确想回归研发的人来说,真正吸引他的,可能就是一个纯粹的研发环境本身。他自己在X上用了“回到研发一线”这几个字。
一个功成名就、财务自由的人,主动选择去别人的下属团队里干活,这本身就在告诉整个行业——他最在乎的到底是什么。
同时,也不能忽略资本市场对这个故事的解读。钛媒体在5月20日的分析中一针见血:“华尔街看不懂大模型,但看得懂Karpathy。”
Anthropic计划在2026年上市,技术和产品虽然也重要,但Karpathy这种图腾级别的技术人物加盟,对华尔街而言本身就是一种强有力的信号——一个全世界最顶级的研究者,愿意在这个时间点把职业生涯押在这家公司。
故事远没有结束。正如36氪所写,硅谷这场AI连续剧还没到大结局。但有一件事已经变得非常清晰:顶级AI人才正在用自己的选择,回答一个整个行业都在追问的问题——下一场技术突破,到底会在哪里发生。
而Karpathy的这张选票,已经投了出去。

