
2025年5月19日,OpenAI联合创始人、「Vibe Coding」之父Andrej Karpathy正式宣布加入Anthropic的预训练团队。他将组建一支新团队,利用Claude来加速预训练研究。一个曾师从Hinton和李飞飞、与奥特曼共事、并担任过马斯克直接下属的人,为何甘愿成为Dario Amodei的「-2」?Anthropic又为何不惜代价招揽他?
5月19日晚上11点,Andrej Karpathy亲自官宣加入Anthropic。

这个名字的分量无需赘述。
他是OpenAI联合创始人、特斯拉前AI总监、「Vibe Coding」之父,也是全球最具影响力的AI教育者之一。
他在AI领域的地位,堪比篮球界的詹姆斯——无论加盟哪支队伍,都会成为头条新闻。
他在X上只发了三句话。

https://x.com/karpathy/status/2056753169888334312
第一句提到,LLM前沿的未来几年「尤其具有塑造性」。第三句重申他对教育的热爱。中间那句最核心——五个词:「回归研发」。
这是两年内,第三位从OpenAI阵营转投Anthropic的核心人物。
也是一个即将40岁、功成名就、财务自由的人,主动选择去给别人的下属当下属。
为什么离开?为什么是Anthropic?Anthropic又为什么非要招他?
每个问题背后,都藏着一层值得深挖的答案。

他去做什么
Karpathy本周已正式入职,加入Anthropic预训练团队。
这个团队由Nick Joseph领导,负责Claude所有大规模训练运行。
Anthropic发言人向TechCrunch确认,Karpathy将组建一个新子团队,专注于利用Claude自身来加速预训练研究。
Nick Joseph也在X上补充道:「他将建立一个团队,专注于用Claude加速预训练研究本身。」

https://x.com/nickevanjoseph/status/2056760504949842219
TechCrunch评价称:「Karpathy是少数能在LLM理论与大规模训练实践之间架起桥梁的研究者之一。」
Axios则将此事定性为「Anthropic在人才争夺中的重大胜利」。
同日,网络安全专家Chris Rohlf也宣布加入Anthropic;此前,xAI创始成员Ross Nordeen已于本月早些时候加盟。人才流向的方向性愈发明显。

https://x.com/chrisrohlf/status/2056744653165092983
Polymarket的数据可作为市场情绪的佐证——交易者对Anthropic在6月底拥有最佳AI模型的概率定价为65%,而OpenAI仅为4%。

https://polymarket.com/event/which-company-has-best-ai-model-end-of-june
Karpathy的加入进一步强化了这一判断。

定义者Karpathy
要理解这次加入的分量,必须先理解Karpathy这个人的稀缺性。
他的稀缺不在于技术能力——顶级研究者有很多。
他的稀缺,在于他能用一个词改变整个行业对某件事的认知。
1986年生于斯洛伐克,15岁移民加拿大多伦多。
在多伦多大学读本科时,他选修了Geoffrey Hinton的课程并参加了其读书会。
Hinton是深度学习复兴运动的精神领袖,2018年图灵奖得主、2024年诺贝尔物理学奖得主。

Karpathy是最早被这把火点燃的年轻人之一。
之后,他在Stanford师从另一位传奇人物李飞飞,博士期间创建了CS231n课程。

这门课从2015年的150名学生增长到2017年的750人,所有视频讲义均公开上网,成为全球无数工程师自学深度学习的第一站,更是计算机视觉领域无可争议的第一神课。

2015年,他成为OpenAI的创始研究科学家。

2017年,他被马斯克招至特斯拉担任AI高级总监,推动自动驾驶走向纯视觉方案。
在这次挖角中,马斯克承受了巨大压力。

https://www.cnbc.com/2026/05/19/anthropic-hires-openai-cofounder-andrej-karpathy-former-tesla-ai-lead.html
同年,Karpathy在Medium上发表文章,提出「Software 2.0」概念,主张神经网络权重就是新的代码,数据集就是新的源代码,梯度下降就是新的编译器。
这个框架重塑了整个行业对「什么是编程」的认知。
2022年离开特斯拉后,他在YouTube上创建了「Neural Networks: Zero to Hero」系列课程,频道突破百万订阅。
同期开源项目micrograd、nanoGPT、nanochat,代码量极少但精准击中核心概念,被称为「可运行的教科书」。
2025年2月,他创造了「Vibe Coding」一词,并被柯林斯词典选为年度词汇。
https://x.com/karpathy/status/1886192184808149383
6月在YC AI Startup School演讲中提出「Software 3.0」和「Agent的十年」框架,成为当年讨论最广的AI演讲之一。
TIME在2024年将他列入「AI领域最具影响力100人」。
从Hinton,到李飞飞,到奥特曼,再到马斯克,他在每个节点都站在最前沿。
但他留下最持久的东西,不是任何一个产品或论文,而是那些概念框架。
Software 2.0、Vibe Coding、LLM OS——这些词改变了人们思考AI的方式。

为什么甘愿做「-2」
Karpathy的职业生涯有一条清晰的线索:他追逐的从来不是头衔。
他做过Hinton和李飞飞的学生、奥特曼的同事、马斯克的直接下属。
每一段经历中,他的组织架构位置都是高层。
现在他加入Anthropic,直接上司是Nick Joseph,预训练负责人。

Nick Joseph汇报给Dario Amodei。
Karpathy在组织架构中排到了第三层。
Nick Joseph是Anthropic创始11人之一,此前曾在Vicarious和OpenAI工作。
在 OpenAI 任职期间,他于安全团队中开展代码模型工作。观察到 GPT-3 经过微调后能够编写代码,他意识到人工智能具备自我改进的潜力。随后,他与安全团队的领导一同离职,共同创立了 Anthropic。
他的团队成功训练出 Claude 全系列模型,其中包含 Mythos。
Karpathy 愿意在 Nick Joseph 麾下从事研究,原因非常直接:这个岗位最接近他渴望从事的工作。
回顾他职业生涯的每一次变动,核心驱动力始终如一:“此刻,最大的实验在哪里”。
2017 年加入特斯拉,是因为自动驾驶是 Software 2.0 时代规模最大的实验场。
2022 年离开,原因是架构已基本定型,后续工作主要聚焦于工程优化。
2023 年重返 OpenAI,因为 ChatGPT 伴随 GPT-4 发布所引发的爆发期,正是最激动人心的前沿领域。
2024 年创办 Eureka Labs,旨在验证 AI 原生教育的假设。
2026 年加入 Anthropic,因为“利用 AI 研究 AI”的预训练革命正在此处发生。
每一次离开都不是出于不满,而是因为当前的位置已不再是最大的实验所在。
为何不回到 OpenAI?人才流动的轨迹给出了答案。
Jan Leike,OpenAI 前对齐团队负责人,于 2024 年 5 月加入 Anthropic。
OpenAI 联合创始人 John Schulman,在同年 8 月紧随其后。
如今,轮到了 Karpathy。
两年内,三位核心人物单向流动,没有任何反向案例可与之相比。
OpenAI 的战略重心已从纯粹的研发转向平台化与收购。从 Chat.com、io Products、Windsurf 到 TBPN,收购的间隔越来越短,金额也越来越大。
这家公司正在演变为“AI 时代的消费巨头”。
对于一个渴望“回归研发”的研究者而言,Anthropic “以研究质量取胜”的路线更具吸引力。
Anthropic 为何如此渴望得到他
Anthropic 的招聘动机可以划分为多个层面。
最表面的一层是技术需求。
即便 Anthropic 的算力预算再庞大,也比不过有微软支持的 OpenAI 和拥有 TPU 的谷歌。
在纯算力堆叠的竞赛中,Anthropic 无法取胜。
它必须找到一种方法,用更少的算力训练出更优质的模型。
“利用 Claude 加速预训练研究”正是这条路径。而 Karpathy 同时具备预训练理论的深度、大规模工程的经验,以及对 AI 辅助研究的直觉,三者兼备的人才极为罕见。
再深入一层是人才信号。
两年内,三位 OpenAI 核心人物单向流入 Anthropic,“一线研究者用脚投票”的叙事已经形成。
每一个 Karpathy 级别的加入,都在降低下一位顶级人才加入的心理门槛。人才吸引人才,形成自我驱动的飞轮。
此外,还有 IPO 前的品牌镀金。
Anthropic 正在以 9000 亿美元的估值洽谈 300 亿美元的融资,IPO 准备工作也在推进。
Karpathy 是 AI 领域公众辨识度最高的技术人物之一:拥有百万 YouTube 订阅者,是年度词汇的创造者,其 CLAUDE.md 仓库在 GitHub 上获得了 22 万星标。
他的名字出现在 Anthropic 的员工名单上,直接为投行提供了一句可以写入招股书的表述。
但最有趣的一层,或许是 Anthropic 并未明确将其作为招聘动机,却注定会收获最大回报的东西——Karpathy 定义范式的能力。
他在 Anthropic 进行的任何技术探索,都会被公开谈论:推文、博客、YouTube 视频。
当他用自己独特的方式为正在发生的事情命名时,Anthropic 便自然而然地成为那个范式的发源地。
招募一位顶级的预训练研究者,同时获得了行业中最具影响力的技术叙事者。
飞轮的临界点
将这次人事变动置于更宏大的背景中,它标志着一个技术拐点。
2026 年 4 月,Anthropic 发布了 Mythos Preview,这是迄今为止最强大的 AI 模型。
Mythos 过于强大,仅能通过 Project Glasswing 受邀内测。
Mythos 在未被专门训练网络安全的情况下,自主发现并利用了 FreeBSD 中一个存在 17 年的远程代码执行漏洞,找到了 OpenBSD 中 27 年的漏洞,以及 FFmpeg 中 16 年的缺陷。
英国 AI 安全研究所的独立评估确认,它是第一个能够从头到尾完成 32 步企业网络攻击模拟的模型。
Anthropic 自己也承认,这些能力并非刻意训练的结果,而是通用推理与软件工程能力提升所引发的“下游涌现”。
预训练做得越好,涌现出的能力就越超出预期。
Mythos 既是当前最强大的模型,也是当前最强大的工具。
Karpathy 来到 Anthropic 要做的,就是拿起这把最强的锤子,去改进锤子本身的制造方式。
利用 Mythos / Claude 来发现更优的训练架构、数据配比和实验方向,使模型改进的速度摆脱人类研究者的线性节奏,启动“AI 改进 AI”的进化飞轮。
这也是 Anthropic 最期望的结局。
当这个飞轮真正转动起来,“AI 自我改进预训练”就不再只是一个研究方向,而是通往 AGI 乃至 ASI 的加速通道。
目前所有关于算力军备竞赛、数据壁垒、人才争夺的竞争维度,都可能被这一个变量改写。
三年内,OpenAI 失去三位核心人物给同一个竞争对手。
这个事实的影响可能比任何融资数字都大。
算力可以用钱购买,数据可以用时间积累,但能够让 AI 进化飞轮转动起来的人,全世界一只手就能数过来。
Karpathy 选择在这个时刻放下自由身份,回到一线。他认为窗口就在眼前。
参考资料:
https://x.com/karpathy/status/2056753169888334312
关注“鲸栖”小程序,掌握最新AI资讯
本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/35571

