小米MiMo团队揭秘:北大系如何打造全球顶尖大模型?

小米MiMo团队揭秘:北大系如何打造全球顶尖大模型?

小米MiMo团队中,每天Agent对话次数少于100次的,就离职吧。

前脚,小米MiMo-V2-Pro模型刚登上OpenRouter调用量榜单第一。后脚,罗福莉就发文分享了自己对于团队管理的思考。热度几乎无缝衔接,网友们的目光也纷纷从模型本身转到小米MiMo团队身上。

小米MiMo团队揭秘:北大系如何打造全球顶尖大模型?

从发布首个推理大模型MiMo-7B至今不到一年时间,MiMo的能力曲线呈现出明显陡升,在短时间内已冲入全球一线梯队。

小米MiMo团队揭秘:北大系如何打造全球顶尖大模型?

相比之下,同样投入重金的Meta超级智能实验室,近期却频频跳票,被爆模型性能远不及早前发布的前沿模型。于是,不少人开始好奇:小米MiMo究竟是一支怎样的团队,竟能在几个月时间内打造出让全球关注的模型?

小米MiMo团队揭秘:北大系如何打造全球顶尖大模型?

众所周知,大模型开发向来是集团军作战,模型卡片的背后往往是多位研究者的集体智慧。据内部消息透露,小米的LLM团队在内部也相当神秘,但通过梳理近半年的模型发布记录和论文,仍能捕捉到一些蛛丝马迹——核心作者大多来自北京大学,其中甚至还有罗福莉本人的师弟。更值得注意的是,北京大学也是罗福莉的老东家DeepSeek的策源地。

关于小米MiMo团队

小米MiMo团队近期的动作引发了外界广泛关注,这种关注与团队在产品侧和论文发表上的“高节奏推进”密不可分。随着多篇研究成果陆续曝光,团队核心成员也浮出水面。

小米MiMo团队揭秘:北大系如何打造全球顶尖大模型? MiMo-7B技术报告核心贡献者

肖邦骏(Bangjun Xiao),MiMo-V2-Flash的第一作者,本科及博士均就读于北京大学。

小米MiMo团队揭秘:北大系如何打造全球顶尖大模型?

其博士生导师为北京大学人工智能研究院副院长黄罡教授。他的研究方向聚焦于边缘计算和联邦学习,此前也曾涉猎计算机视觉和扩散模型。

Bingquan Xia,MiMo-V2-Flash核心作者之一,中科院计算技术研究所2021届研究生。

小米MiMo团队揭秘:北大系如何打造全球顶尖大模型?

马文晗(Wenhan Ma),自2025年9月起在北京大学计算机科学学院攻读博士,由穗志方教授指导。

小米MiMo团队揭秘:北大系如何打造全球顶尖大模型?

他的研究方向为大语言模型,近期主要关注提升大语言模型的推理能力。本科毕业于北京大学电子工程与计算机科学学院,专业为计算机科学与技术。值得一提的是,穗志方教授正是罗福莉在北大的导师,而马文晗则是罗福莉的同门师弟

小米MiMo团队揭秘:北大系如何打造全球顶尖大模型? 罗福莉(后排左二)与导师穗志方教授(前排右二)合影

朱大为(Dawei Zhu),北京大学三年级博士生,导师为李素建教授,本科毕业于北京大学电子工程与计算机科学学院。

小米MiMo团队揭秘:北大系如何打造全球顶尖大模型?

研究方向为长上下文建模,他认为高效处理超长上下文是未来语言模型和多模态模型的关键能力,也对智能体(Agent)、对齐(Alignment)以及多模态模型的进展感兴趣。此前,他参与的《paperbanana》项目曾引起较大关注。

小米MiMo团队揭秘:北大系如何打造全球顶尖大模型?

董谨豪,中国人民大学信息学院/数据工程与知识工程教育部重点实验室讲师,同时也是小米大语言模型(LLM)核心团队技术顾问,主要负责与代码相关的LLM开发,包括预训练、强化学习及智能体方向。

小米MiMo团队揭秘:北大系如何打造全球顶尖大模型?

他主导建立了人大-小米基础大语言模型联合重点实验室,并担任技术委员会成员。他博士毕业于北京大学计算机科学学院,本科毕业于西安电子科技大学计算机科学与技术专业。

张海林,小米MiMo团队成员,专注于AI基础设施建设,为MiMo系列模型打造高效、可扩展且稳定的强化学习(RL)基础设施。

小米MiMo团队揭秘:北大系如何打造全球顶尖大模型?

他于2025年获得北京大学计算机科学博士学位,导师为崔斌教授,并曾获北京大学优秀博士论文奖。研究重点包括大规模大语言模型(LLMs)、深度学习推荐模型(DLRMs)、信息检索(IR)及通用分布式计算。

此外,还有诸多核心作者,但公开信息较少,部分谷歌主页如下:
小米MiMo团队揭秘:北大系如何打造全球顶尖大模型?
小米MiMo团队揭秘:北大系如何打造全球顶尖大模型?

小米MiMo是一支怎样的团队

一支成立才一两年的团队,能一路冲到顶尖模型研发的前列,靠的绝不只是产品节奏和核心成员这么简单。仔细梳理团队的背景,会发现一个明显的共性——北大背景浓厚。从核心成员到技术骨干,很多团队成员本科或博士均来自北京大学计算机学院。

一方面,北大的同门关系、导师体系和院系传承,使得小米在大模型工业界作为后起之秀,能够源源不断地吸纳新鲜血液;另一方面,学生们也能迅速接触工业界,借助丰富的算力和资源,将科研想法高效落地与迭代。在这个过程中,罗福莉成为团队与北大学术背景之间的重要桥梁。

小米MiMo团队揭秘:北大系如何打造全球顶尖大模型?

除了院校背景对成员产品理念的影响外,小米MiMo团队的技术理念也深受小米企业产品基因的驱动——核心是产品层面的“性价比”和公司一贯的“互联网生态”思维。体现在MiMo模型上,最直观的就是7B参数规模、开源策略以及端侧部署方向,清晰地展现了小米的战略布局和生态思路。

因此,MiMo的成功并非偶然,而是多重因素叠加的结果:北大科研背景的厚度、核心成员的技术经验,以及小米产品与工程的基因驱动,共同铸就了这支年轻团队的迅速崛起。

还有一个颇有缘分的小细节值得一提——不久前从阿里离职的通义实验室Qwen大模型负责人林俊旸,正是罗福莉的师兄。两人硕士阶段均在北京大学从事自然语言处理相关学习研究,学术路径高度同源。毕业后又先后加入阿里达摩院,在大模型研发上有着相近的技术底色与行业视野。一个曾做Qwen,一个带MiMo。两条国内头部模型线的关键人物,曾成长于同一套学术和产业体系,这层关系本身也让不少业内人多看了一眼。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/26515

(0)
上一篇 2026年3月19日 下午8:04
下一篇 2026年3月20日 上午11:04

相关推荐

  • 工具文档质量成AI智能体瓶颈?ICLR 2026新研究:简单文档扩展即可显著提升工具检索性能

    在大模型时代,工具调用(Tool-Use)已成为智能体能力的核心。从代码生成到复杂API调用,大语言模型正在学会使用各类工具。然而,一个日益凸显的现实问题是:工具真的难找。 来自宁波东方理工大学/宁波数字孪生研究院沈晓宇团队的一项研究,在ICLR 2026发表论文《Tools Are Under-Documented: Simple Document Exp…

    2026年3月18日
    39300
  • MiniMax如何借助阿里云重塑Agent底座,撑起智能体时代的系统变革

    2026年初,随着OpenClaw的爆火,AI领域正式步入了Harness时代。在这场技术浪潮中,MiniMax凭借敏锐的技术洞察,成为变革的核心参与者之一。 其近期相继推出的云端AI助手MaxClaw以及全新发布的MaxHermes便是例证。这两款应用分别基于OpenClaw架构与近期备受关注的Hermes Agent构建,旨在消除本地部署服务器与配置AP…

    2026年4月16日
    38800
  • 别再把 AI 当“自动补全”了:代码智能体真正的用法被忽视了

    写出更简洁、更聪明的 Python 函数 许多开发者,包括经验丰富的老手,在编写 Python 函数时都会不自觉地陷入一些常见陷阱。这些做法短期内或许不会引发问题,但随着代码库的增长,它们会导致代码变得难以维护、效率低下。 如果你对 Python 函数的理解还停留在“能跑就行”,现在是时候升级你的认知了。了解这些常见误区并采用最佳实践,能让你的代码焕然一新。…

    2025年11月10日
    39700
  • 重放驱动验证:突破CPU-GPU芯粒架构流片前验证瓶颈的创新方法

    关键词: 重放驱动验证、CPU-GPU 架构、ODIN 芯粒、片上网络、流片前验证 CPU 与 GPU 技术的融合是支撑现代人工智能和图形学工作负载的核心技术,该融合架构兼具面向控制的处理能力与大规模并行计算能力。 随着芯片设计向芯粒(Chiplet)架构演进,紧耦合 CPU-GPU 子系统的流片前验证面临诸多严峻挑战:* 验证框架搭建复杂度高* 设计规模庞…

    2026年4月1日
    27400
  • NVlabs FVRuleLearner:用算子推理树终结LLM写SystemVerilog断言的时序错误,形式验证正确率飙升

    利用大语言模型将自然语言描述转化为 SystemVerilog 断言(SVA),表面上是“代码生成”的一个应用分支,但其真正的挑战并非语法,而是语义。例如,一个“握手后必须响应”的需求,可能涉及时序蕴含、复位屏蔽、信号稳定性、延迟窗口以及位级抽象等多种微妙的逻辑选择。 研究论文揭示,在自然语言到 SVA(NL-to-SVA)任务中,超过 80% 的功能性错误…

    大模型工程 4天前
    7000