打破模态孤岛：全模态分子设计基座模型ODesign，让AI像设计语言一样设计分子

过去几年，AI4Bio领域最令人印象深刻的进展，莫过于Google DeepMind推出的AlphaFold。这项技术让AI能够大规模且接近实验精度地“洞察”蛋白质的三维结构。到了AlphaFold 3时代，AI甚至开始深入理解由蛋白质、核酸、小分子和离子构成的多组分复合体。

然而，生命工程真正追求的目标，远不止于“观察”。它渴望的是“设计”——设计一个分子，使其能够在正确的位置、以正确的方式与目标相互作用，从而调控信号通路、改变病理过程，甚至重塑某种生命功能。

打破模态孤岛：全模态分子设计基座模型ODesign，让AI像设计语言一样设计分子

以核糖体为例，它不仅是蛋白质、RNA与小分子药物协同作用的分子机器，也是众多小分子药物的作用靶点。

这正是当前AI分子设计所面临的核心瓶颈。

过去的AI分子设计并非毫无建树，但许多能力仍被困在“模态孤岛”之中：蛋白质设计、小分子生成与分子对接、核酸结构建模，这些领域长期各自为政，互不联通。

注：此处“模态”并非指文本、图像或音频，而是指蛋白质、小分子、核酸等不同类别的生命分子，它们可被视为不同类型的“Token”。

这并非模型数量的问题，而是在表征方式、训练数据和任务目标被割裂后，AI很难在同一套框架内连续地理解和设计跨模态的相互作用。

然而，真实的生命系统从不遵循这些人为划定的边界。在一个靶点场景中，多模态共存是常态。疾病的发生机制，往往取决于分子之间如何识别、结合、调控以及失衡。

既然生命问题天然具有跨模态属性，为什么分子设计模型还要被模态的边界所限制？

从全模态分子设计
迈向分子世界模型

“物理学中存在四种基本相互作用力。在这个框架下，生物分子之间的相互作用，本质上都可以理解为电磁相互作用的不同阶展开。” 这意味着，蛋白质、核酸、小分子等标签，只是人类为了理解生命系统而设定的分类；但在更底层的原子尺度上，分子之间遵循着统一的物理相互作用规律。

既然底层物理规律是统一的，那么学习分子相互作用的AI，也不应该被模态标签所束缚。

这套极具穿透力的底层逻辑，出自一位“很不单模态”的年轻科学家——张昊天。

张昊天在本科阶段同时修读了浙江大学的物理学与药学专业，随后获得浙江大学医学硕士学位，并前往华盛顿大学继续从事计算机方向的研究。从物理的底层规律、医学的生命表象，到计算机的建模推演，张昊天本人的学术轨迹，本身就是对“打破边界”这一理念最生动的诠释。

这种交叉学科背景，使他既能从原子尺度理解分子间的相互作用，也能从模型视角重新构建分子设计问题。

此前，由张昊天作为第一作者兼共同通讯作者，在临港实验室联合上海浦江实验室、华盛顿大学、哈佛大学、MIT等科研力量共同推进的ODesign开源科研项目，被定位为全球首个面向全模态的分子设计基座模型。

打破模态孤岛：全模态分子设计基座模型ODesign，让AI像设计语言一样设计分子

论文地址：https://odesign1.github.io/static/pdfs/technical_report.pdf
试用地址：https://odesign.lglab.ac.cn/

ODesign试图将蛋白质、DNA、RNA、小分子与离子等多模态实体纳入同一套生成框架，让AI学习它们之间的相互作用，并在分子整体、功能基序、提示原子三种粒度下，实现任意两类分子之间的可控设计。

在张昊天看来，该项目要证明的并非“一个模型能多做几类任务”，而是一个更根本的问题：如果生命分子的相互作用本质上是跨模态的，那么模型也必须具备跨模态学习和生成的能力。否则，任何单一模态的建模，本质上都是在用一个被截断的世界去近似真实系统，最终只能依赖大规模筛选来弥补建模能力的不足。因此，基于研究团队在分子设计模型上的研究基础与长期积累，ODesign尝试在这一方向上做出探索：在同一生成框架下，对蛋白质、DNA、RNA、小分子与离子等不同模态进行统一表示，使模型能够在一定程度上学习它们之间的相互作用，并支持跨模态的联合建模与设计。

打破模态孤岛：全模态分子设计基座模型ODesign，让AI像设计语言一样设计分子

ODesign全模态生成框架示意图。ODesign将蛋白、DNA、RNA、小分子与离子纳入同一生成框架，支持不同分子类型之间的all-to-all设计，并可在刚性或柔性靶标条件下生成目标结合分子。来源：《ODesign: A World Model for Biomolecular Interaction Design》

支撑这一宏大愿景的，是一支“从2024诺贝尔化学奖实验室走出来”的年轻科学家团队。2024年，David Baker因“计算蛋白设计”荣获诺贝尔化学奖。ODesign项目组的核心成员——张昊天、应可钧、王佳淇——均来自Baker Lab。该团队同时具备前沿AI建模能力、计算蛋白设计训练背景以及干湿闭环理解，是国内少数真正站在AI4Science与生命分子设计交叉点的团队。

统一表征与涌现
世界模型的雏形

跨模态的理念，必须在工程上落地为统一的表征。

ODesign面临的第一个难题是：蛋白质、小分子、核酸的结构差异巨大，如何让同一套模型真正“读懂”不同的分子？

研究团队的思路，是寻找不同模态之间可以共享的“最小化学生成单元”（MCGU）。模型不再将蛋白质、小分子、核酸视为割裂的对象，而是先将其拆解到统一的化学基元层面，再通过Modality Token和Unit Token进行表征。推理时，模型先围绕共享基元生成，再补齐不同模态特有的原子信息。

打破模态孤岛：全模态分子设计基座模型ODesign，让AI像设计语言一样设计分子

ODesign的统一表征架构。模型将不同分子类型的最小化学生成单元抽象为统一token，并通过Pairformer学习其与目标结构之间的相互作用，再由全原子扩散模块生成满足空间约束的三维结构。

这不仅是工程技巧，更是实现跨模态迁移的前提：只有在表征层打通壁垒，模型才能学到超越单一分子类型的通用互作规律，找到一种统一的“分子语言”。

在此基础上，ODesign还构建了一套以结构预测为基础的生成式架构。团队先训练结构预测框架，再重构信息流和目标函数，让模型从“预测这些分子会形成什么结构”，转向“生成一个能按预期发生作用的新分子”。前者是理解结构，后者是设计关系。

那么，这种统一表征是否真的带来了新能力？

目前的验证结果显示，ODesign的价值不仅在于“一个模型能做更多任务”，更在于它展现了在不同模态之间的迁移能力。

在蛋白质设计上，ODesign首先证明了自己的实力。其计算通量相比RFDiffusion提升了约10倍，在RFDiffusion2的AME测试集上，ODesign-Flex实现了相较于RFDiffusion2高达20倍的设计候选通量提升。

更关键的验证体现在低数据模态——核酸上。相比蛋白质，核酸的数据量更少，成熟模型也更少。ODesign在RNA单体设计上的成功率约为RNAFrameFlow的两倍；在训练集外的蛋白-RNA复合体零样本设计中，平均成功率达到77.9%。这表明它绝非“披着全模态外衣的蛋白质模型”，而是真正将蛋白质场景中学到的互作规律，迁移到了RNA、DNA等低数据模态。

打破模态孤岛：全模态分子设计基座模型ODesign，让AI像设计语言一样设计分子

ODesign在核酸设计任务中的跨模态迁移验证。在RNA/DNA单体生成与蛋白结合aptamer设计中，ODesign展现出向低数据核酸模态迁移互作规律的能力，其中protein-binding RNA任务体现了其零样本设计潜力。

小分子则更贴近药物研发场景。ODesign在蛋白结合小分子任务上，性能较SurfGen提升了超过40倍，并覆盖了DNA/RNA结合小分子设计。这不再是旧任务上的刷分，而是触及了传统小分子模型无法处理的盲区。

打破模态孤岛：全模态分子设计基座模型ODesign，让AI像设计语言一样设计分子

ODesign在小分子设计任务中的表现。在蛋白、DNA、RNA结合小分子设计中，ODesign展现出跨靶标类型生成小分子的能力，开始覆盖传统专家模型更难处理的跨模态设计组合。

在计算指标之外，最终的评价标准仍然是湿实验——即在真实的生物实验体系中进行检测、筛选与确认。

据张昊天介绍，ODesign 已在 8 个靶点上获得了从 nM 级到 pM 级亲和力的候选分子。与 RFDiffusion、BindCraft、BoltzGen、PXDesign 等方法相比，ODesign 在蛋白质设计（protein design）任务中，将结合亲和力（binding affinity）提升了数倍至数百倍。这标志着 ODesign 已真正进入生物实验验证阶段。

统一生成、跨模态迁移与实验验证的闭环打通，正是“分子世界模型雏形”的核心价值所在。它证明模型终于跨越了模态边界，开始学习分子世界更深层的相互作用规律。

从基座到闭环：重构科学发现的基础设施

然而，作为一个开源科研型项目，ODesign 对团队而言远非终点。作为原型机，它验证了统一生成与跨模态迁移的可行性，但距离一个真正的微观分子世界模型仍有差距。此外，它尚未被封装为可规模化、可验证、可容错的产业工具。真正的挑战在于：如何从一个能生成分子的模型，进化为一个能参与真实药物研发全流程的系统。

为解决这一问题，张昊天决定独立创业，联合应可钧、王佳淇等志同道合的伙伴，共同创立了英灵殿科技，并完成了由五源资本领投的首轮融资。

张昊天团队从技术路径出发，将这条道路拆解为三个清晰的台阶：AI4Bio、AI4AI 与 AI4Phy。

短期来看，AI4Bio 是商业化入口，从真实的生物分子设计任务切入，服务于药企和科研机构。在真实的药物研发中，模型不能只看结合力，还必须应对毒性、渗透性、免疫原性、可合成性等多重约束。

中期来看，AI4AI 指向自我迭代的科学智能框架。

当前，AI4Science 面临一个现实困境：许多模型能刷新 Benchmark，却难以真正说服客户。问题不仅在于结果不够好，更在于模型输出往往仍是黑箱——它为什么这样设计？依据是什么？失败后该如何调整？

AI4AI 试图解决的正是这一问题。它将非结构化文献、实验数据和模型输出整合为可导航的知识拓扑，让模型不仅能给出答案，还能围绕假设提出、归因评估和结果优化进行持续推理。

再往后，则是 AI4Phy，即自驱动实验室。

模型生成候选分子，实验系统完成合成、纯化、测试，结果再反馈回模型，推动下一轮设计。这一循环一旦建立，模型就不再仅仅依赖历史数据，而是在真实反馈中不断自我校正。

这正是分子世界模型与普通生成模型拉开差距的地方。

普通生成模型能给出候选方案，而世界模型需要理解的是：一个分子设计进入真实物理世界后，会发生什么、失败在哪里、又该如何修正。

要做到这一点，比拼的就不只是模型能力，而是团队能否同时理解科学问题、实验反馈与产业流程。

这也是英灵殿团队结构值得关注的原因。张昊天横跨物理、药学、医学与计算机领域；CTO 应可钧拥有哈佛生物医学与计算机背景，并在斯坦福医学院和 Baker Lab 从事过博士后研究；联合创始人王佳淇则长期聚焦大模型与计算生物学的交叉研究。

这种交叉结构，恰好对应了 AI Biotech 最难的环节：模型生成的结果，必须被生物学问题定义、被化学规则约束、被实验体系验证，最终还要被产业流程承接。

这支从 Baker Lab 走出的团队，也让五源资本愿意在早期下注。投资人表示，团队兼具算法能力、生命科学理解、干湿闭环能力与企业家精神，是他们愿意长期陪伴的科学创业力量。

当分子间的相互作用开始被模型统一学习、生成和验证，AI4Bio 的叙事逻辑正在发生变化。它不再仅仅是更快地发现候选分子，而是让科学家以一种更可编程的方式提出假设、生成设计、进入实验，再用真实结果反哺模型。

AlphaFold 让 AI4Bio 的第一场革命发生在“看见结构”，而英灵殿科技想挑战的，是下一步：让 AI 不仅能理解生命分子如何相互作用，还能模拟、设计微观世界的动态过程，最终走向对生命功能本身的模拟与重构。

关注“鲸栖”小程序，掌握最新AI资讯

本文来自网络搜集，不代表鲸林向海立场，如有侵权，联系删除。转载请注明出处：https://www.itsolotime.com/archives/32562

打破模态孤岛：全模态分子设计基座模型ODesign，让AI像设计语言一样设计分子

相关推荐

硅谷异类：7人团队打造千万用户笔记软件，拒绝资本、无会议文化成就商业奇迹

GitHub 六大 Agent 开源项目：从零构建智能体，打破信息壁垒

nncase：基于e-graph的端到端LLM编译器，突破异构存储架构性能瓶颈

蚂蚁灵波开源300万对RGB-D数据集，破解空间智能数据瓶颈

30秒极速部署：PinMe开源神器让静态网站上线零门槛