DeepSeek核心工程师郭达雅离职:V2、V3、R1模型核心作者
DeepSeek核心工程师郭达雅被曝离职。作为公司V2、V3、R1等一系列模型的核心作者,他的动向备受关注。
这位曾被导师寄予厚望成为“中山大学雷军”的技术天才,在学术与竞赛领域有着近乎传奇的履历:自述在博士入学第三天便完成了毕业所需的论文发表要求;多次在腾讯广告算法大赛中蝉联冠军,并在ATEC科技精英赛和微信大数据挑战赛中斩获头筹,被调侃“还没毕业就有着百万奖金”。
此外,他还曾出现在以程序员为主题的真人秀《燃烧吧!天才程序员》中,作为仅有的两名SSS级“巨佬”选手之一,在60小时的极限挑战中展现了顶尖的编码实力。
消息传出后,也引发了外网网友的关注,有人表示希望这不会给DeepSeek-V4的研发带来影响。

毕竟,郭达雅自2023年博士毕业后加入DeepSeek,便深度参与了从Coder、Math等专项模型,到V2、V3乃至R1的完整研发链条,且均是核心作者。
那么,郭达雅究竟是怎样的“天才少年”?
DeepSeek多款模型的核心贡献者
郭达雅于2023年博士毕业后加入DeepSeek,专注于代码智能与大语言模型推理方向。
他加入DeepSeek的原因,与一位师姐的介绍直接相关。据他本人所述:
当时,我的一位师姐在DeepSeek工作,她找到了我,跟我聊了DeepSeek的愿景——追求AGI,推动人类社会的加速发展。这跟我的价值观是相合的。同时,DeepSeek有比较多的资源投入研发,领导层也希望打造一个有创新氛围和自由的公司。我有这样的热情去做这件事,我也想追求这样的工作环境。最终,我选择加入了DeepSeek。
目前,郭达雅的个人主页信息尚未更新,仍显示为DeepSeek研究员。

在DeepSeek任职期间,郭达雅是公司一系列重要模型的核心贡献者,包括V2、V3、R1,以及Math、Coder、Prover和V2-Prover等专项模型。

按时间线梳理其核心贡献:
- 2024年1月 – DeepSeek-Coder:该项目推出了从1.3B到33B的一系列开源代码模型,在多项基准测试中达到了当时的开源代码模型SOTA水平。

- 2024年2月 – DeepSeek-Math:该项目以DeepSeek-Coder-Base-v1.5 7B为基础,针对数学推理能力进行了继续训练,额外使用了120B数学相关token。其论文中提出的新型强化学习方法GRPO,后来成为了R1推理模型的关键技术。

- 2024年5月 – DeepSeek-Prover:该项目面向Lean 4定理证明,核心方法是大规模合成形式化证明数据,并在此基础上微调DeepSeek-Math 7B。模型在Lean 4 miniF2F基准上取得了优于GPT-4的成绩,标志着DeepSeek的模型能力从一般数学推理延伸到了更硬核的形式化推理领域。

- V2、V3与R1系列:在这一系列核心模型的研发过程中,DeepSeek证明了不依赖人工标注的推理轨迹,仅通过纯强化学习也能有效激发大模型的推理能力,并自然涌现出自反思、验证、动态策略调整等行为模式。其中,DeepSeek-R1的相关论文后来登上了《自然》(Nature)杂志封面。该论文披露,R1的训练成本仅约29.4万美元(折合人民币约208万元)。

总体而言,郭达雅在DeepSeek的任职并非参与单点项目,而是深度参与了贯穿公司一整段主线模型的完整研发过程。
“希望他成为中山大学的雷军”
郭达雅对计算机科学的兴趣始于中学时代。他就读于珠海一中时,通过学校的信息课首次接触到编程,并被其严谨的逻辑性和无限的创造力所吸引,这促使他在高考后坚定地选择了计算机专业。
2014年,郭达雅被中山大学计算机学院录取,并随后在本校直博深造。

大四时,他入选中山大学与微软亚洲研究院(MSRA)的联合培养博士生项目,师从印鉴教授和周明博士(后者后来在大模型浪潮中创办了澜舟科技),研究方向为自然语言处理。京东探索研究院副院长、阶跃星辰Tech Fellow段楠的博士生导师也是周明,两人算是师出同门。
据中山大学的采访报道,郭达雅自称在博士刚入学的第三天,就完成了学校博士毕业所要求的论文发表条件。
读博期间,他在MSRA实习,并完成了CodeBert以及GraphCodeBert的研究,相关成果分别发表在EMNLP 2020 Findings和ICLR 2021上。其中,CodeBert开发了首个能同时处理自然语言与编程语言混合输入的双模态预训练模型;GraphCodeBert则首次将代码的数据流结构纳入预训练,深化了模型对代码的理解。


2023年,他的博士论文《基于预训练的程序理解与生成》获评中山大学优秀博士学位论文。从学术研究到在DeepSeek的工作,郭达雅的研究主线始终紧密围绕“代码”展开。
在DeepSeek-V3发布后,他的导师印鉴教授曾特别寄语,希望他能成为 “中山大学的雷军” 。
截至目前,郭达雅已在NeurIPS、ACL、EMNLP等国际顶级AI会议发表论文十余篇,谷歌学术引用量超1300次。
在竞赛方面,郭达雅同样战绩斐然:
* 2021、2022年,连续两年夺得蚂蚁集团主办的ATEC科技精英赛冠军。
* 2022年,在3200支队伍参与的微信大数据挑战赛中带队夺冠,赢得30万元大奖。

* 最具代表性的是在腾讯广告算法大赛中实现连续夺冠。作为DYG战队核心成员,他在2019年获得冠军,2020年成功卫冕,2021年再度夺冠,堪称该赛事的名人堂级选手。
One More Thing
除了学术与竞赛,郭达雅还有颇为“出圈”的一面——参加综艺节目。

在以程序员为主题的真人秀《燃烧吧!天才程序员》中,郭达雅作为仅有的两名SSS级“巨佬”选手之一,与其他15名选手共同经历了60小时的代码极限挑战。其出场时便被标注为“神一样的存在”,展现了顶尖程序员实力之外的个人魅力。
如今,随着这位核心工程师的离职,其未来的动向无疑将成为业界关注的焦点。
谁又能得到郭达雅呢?
参考链接:
[1] https://www.reddit.com/r/LocalLLaMA/comments/1rzu7rc/deepseek_core_researcher_daya_guo_rumored_to_have/
[2] https://guoday.github.io/
[3] https://mp.weixin.qq.com/s/bYztba9PwPHePhwufd4L7Q
[4] https://sai.sysu.edu.cn/node/545

关注“鲸栖”小程序,掌握最新AI资讯
本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/27012


