过去几年,AI4Bio领域最令人印象深刻的进展,莫过于Google DeepMind推出的AlphaFold。这项技术让AI能够大规模且接近实验精度地“洞察”蛋白质的三维结构。到了AlphaFold 3时代,AI甚至开始深入理解由蛋白质、核酸、小分子和离子构成的多组分复合体。
然而,生命工程真正追求的目标,远不止于“观察”。它渴望的是“设计”——设计一个分子,使其能够在正确的位置、以正确的方式与目标相互作用,从而调控信号通路、改变病理过程,甚至重塑某种生命功能。

以核糖体为例,它不仅是蛋白质、RNA与小分子药物协同作用的分子机器,也是众多小分子药物的作用靶点。
这正是当前AI分子设计所面临的核心瓶颈。
过去的AI分子设计并非毫无建树,但许多能力仍被困在“模态孤岛”之中:蛋白质设计、小分子生成与分子对接、核酸结构建模,这些领域长期各自为政,互不联通。
注:此处“模态”并非指文本、图像或音频,而是指蛋白质、小分子、核酸等不同类别的生命分子,它们可被视为不同类型的“Token”。
这并非模型数量的问题,而是在表征方式、训练数据和任务目标被割裂后,AI很难在同一套框架内连续地理解和设计跨模态的相互作用。
然而,真实的生命系统从不遵循这些人为划定的边界。在一个靶点场景中,多模态共存是常态。疾病的发生机制,往往取决于分子之间如何识别、结合、调控以及失衡。
既然生命问题天然具有跨模态属性,为什么分子设计模型还要被模态的边界所限制?
从全模态分子设计
迈向分子世界模型
“物理学中存在四种基本相互作用力。在这个框架下,生物分子之间的相互作用,本质上都可以理解为电磁相互作用的不同阶展开。” 这意味着,蛋白质、核酸、小分子等标签,只是人类为了理解生命系统而设定的分类;但在更底层的原子尺度上,分子之间遵循着统一的物理相互作用规律。
既然底层物理规律是统一的,那么学习分子相互作用的AI,也不应该被模态标签所束缚。
这套极具穿透力的底层逻辑,出自一位“很不单模态”的年轻科学家——张昊天。
张昊天在本科阶段同时修读了浙江大学的物理学与药学专业,随后获得浙江大学医学硕士学位,并前往华盛顿大学继续从事计算机方向的研究。从物理的底层规律、医学的生命表象,到计算机的建模推演,张昊天本人的学术轨迹,本身就是对“打破边界”这一理念最生动的诠释。
这种交叉学科背景,使他既能从原子尺度理解分子间的相互作用,也能从模型视角重新构建分子设计问题。
此前,由张昊天作为第一作者兼共同通讯作者,在临港实验室联合上海浦江实验室、华盛顿大学、哈佛大学、MIT等科研力量共同推进的ODesign开源科研项目,被定位为全球首个面向全模态的分子设计基座模型。

- 论文地址:https://odesign1.github.io/static/pdfs/technical_report.pdf
- 试用地址:https://odesign.lglab.ac.cn/
ODesign试图将蛋白质、DNA、RNA、小分子与离子等多模态实体纳入同一套生成框架,让AI学习它们之间的相互作用,并在分子整体、功能基序、提示原子三种粒度下,实现任意两类分子之间的可控设计。
在张昊天看来,该项目要证明的并非“一个模型能多做几类任务”,而是一个更根本的问题:如果生命分子的相互作用本质上是跨模态的,那么模型也必须具备跨模态学习和生成的能力。否则,任何单一模态的建模,本质上都是在用一个被截断的世界去近似真实系统,最终只能依赖大规模筛选来弥补建模能力的不足。因此,基于研究团队在分子设计模型上的研究基础与长期积累,ODesign尝试在这一方向上做出探索:在同一生成框架下,对蛋白质、DNA、RNA、小分子与离子等不同模态进行统一表示,使模型能够在一定程度上学习它们之间的相互作用,并支持跨模态的联合建模与设计。

ODesign全模态生成框架示意图。ODesign将蛋白、DNA、RNA、小分子与离子纳入同一生成框架,支持不同分子类型之间的all-to-all设计,并可在刚性或柔性靶标条件下生成目标结合分子。来源:《ODesign: A World Model for Biomolecular Interaction Design》
支撑这一宏大愿景的,是一支“从2024诺贝尔化学奖实验室走出来”的年轻科学家团队。2024年,David Baker因“计算蛋白设计”荣获诺贝尔化学奖。ODesign项目组的核心成员——张昊天、应可钧、王佳淇——均来自Baker Lab。该团队同时具备前沿AI建模能力、计算蛋白设计训练背景以及干湿闭环理解,是国内少数真正站在AI4Science与生命分子设计交叉点的团队。
统一表征与涌现
世界模型的雏形
跨模态的理念,必须在工程上落地为统一的表征。
ODesign面临的第一个难题是:蛋白质、小分子、核酸的结构差异巨大,如何让同一套模型真正“读懂”不同的分子?
研究团队的思路,是寻找不同模态之间可以共享的“最小化学生成单元”(MCGU)。模型不再将蛋白质、小分子、核酸视为割裂的对象,而是先将其拆解到统一的化学基元层面,再通过Modality Token和Unit Token进行表征。推理时,模型先围绕共享基元生成,再补齐不同模态特有的原子信息。

ODesign的统一表征架构。模型将不同分子类型的最小化学生成单元抽象为统一token,并通过Pairformer学习其与目标结构之间的相互作用,再由全原子扩散模块生成满足空间约束的三维结构。
这不仅是工程技巧,更是实现跨模态迁移的前提:只有在表征层打通壁垒,模型才能学到超越单一分子类型的通用互作规律,找到一种统一的“分子语言”。
在此基础上,ODesign还构建了一套以结构预测为基础的生成式架构。团队先训练结构预测框架,再重构信息流和目标函数,让模型从“预测这些分子会形成什么结构”,转向“生成一个能按预期发生作用的新分子”。前者是理解结构,后者是设计关系。
那么,这种统一表征是否真的带来了新能力?
目前的验证结果显示,ODesign的价值不仅在于“一个模型能做更多任务”,更在于它展现了在不同模态之间的迁移能力。
在蛋白质设计上,ODesign首先证明了自己的实力。其计算通量相比RFDiffusion提升了约10倍,在RFDiffusion2的AME测试集上,ODesign-Flex实现了相较于RFDiffusion2高达20倍的设计候选通量提升。
更关键的验证体现在低数据模态——核酸上。相比蛋白质,核酸的数据量更少,成熟模型也更少。ODesign在RNA单体设计上的成功率约为RNAFrameFlow的两倍;在训练集外的蛋白-RNA复合体零样本设计中,平均成功率达到77.9%。这表明它绝非“披着全模态外衣的蛋白质模型”,而是真正将蛋白质场景中学到的互作规律,迁移到了RNA、DNA等低数据模态。

ODesign在核酸设计任务中的跨模态迁移验证。在RNA/DNA单体生成与蛋白结合aptamer设计中,ODesign展现出向低数据核酸模态迁移互作规律的能力,其中protein-binding RNA任务体现了其零样本设计潜力。
小分子则更贴近药物研发场景。ODesign在蛋白结合小分子任务上,性能较SurfGen提升了超过40倍,并覆盖了DNA/RNA结合小分子设计。这不再是旧任务上的刷分,而是触及了传统小分子模型无法处理的盲区。

ODesign在小分子设计任务中的表现。在蛋白、DNA、RNA结合小分子设计中,ODesign展现出跨靶标类型生成小分子的能力,开始覆盖传统专家模型更难处理的跨模态设计组合。
在计算指标之外,最终的评价标准仍然是湿实验——即在真实的生物实验体系中进行检测、筛选与确认。
据张昊天介绍,ODesign 已在 8 个靶点上获得了从 nM 级到 pM 级亲和力的候选分子。与 RFDiffusion、BindCraft、BoltzGen、PXDesign 等方法相比,ODesign 在蛋白质设计(protein design)任务中,将结合亲和力(binding affinity)提升了数倍至数百倍。这标志着 ODesign 已真正进入生物实验验证阶段。
统一生成、跨模态迁移与实验验证的闭环打通,正是“分子世界模型雏形”的核心价值所在。它证明模型终于跨越了模态边界,开始学习分子世界更深层的相互作用规律。
从基座到闭环:重构科学发现的基础设施
然而,作为一个开源科研型项目,ODesign 对团队而言远非终点。作为原型机,它验证了统一生成与跨模态迁移的可行性,但距离一个真正的微观分子世界模型仍有差距。此外,它尚未被封装为可规模化、可验证、可容错的产业工具。真正的挑战在于:如何从一个能生成分子的模型,进化为一个能参与真实药物研发全流程的系统。
为解决这一问题,张昊天决定独立创业,联合应可钧、王佳淇等志同道合的伙伴,共同创立了英灵殿科技,并完成了由五源资本领投的首轮融资。
张昊天团队从技术路径出发,将这条道路拆解为三个清晰的台阶:AI4Bio、AI4AI 与 AI4Phy。
短期来看,AI4Bio 是商业化入口,从真实的生物分子设计任务切入,服务于药企和科研机构。在真实的药物研发中,模型不能只看结合力,还必须应对毒性、渗透性、免疫原性、可合成性等多重约束。
中期来看,AI4AI 指向自我迭代的科学智能框架。
当前,AI4Science 面临一个现实困境:许多模型能刷新 Benchmark,却难以真正说服客户。问题不仅在于结果不够好,更在于模型输出往往仍是黑箱——它为什么这样设计?依据是什么?失败后该如何调整?
AI4AI 试图解决的正是这一问题。它将非结构化文献、实验数据和模型输出整合为可导航的知识拓扑,让模型不仅能给出答案,还能围绕假设提出、归因评估和结果优化进行持续推理。
再往后,则是 AI4Phy,即自驱动实验室。
模型生成候选分子,实验系统完成合成、纯化、测试,结果再反馈回模型,推动下一轮设计。这一循环一旦建立,模型就不再仅仅依赖历史数据,而是在真实反馈中不断自我校正。
这正是分子世界模型与普通生成模型拉开差距的地方。
普通生成模型能给出候选方案,而世界模型需要理解的是:一个分子设计进入真实物理世界后,会发生什么、失败在哪里、又该如何修正。
要做到这一点,比拼的就不只是模型能力,而是团队能否同时理解科学问题、实验反馈与产业流程。
这也是英灵殿团队结构值得关注的原因。张昊天横跨物理、药学、医学与计算机领域;CTO 应可钧拥有哈佛生物医学与计算机背景,并在斯坦福医学院和 Baker Lab 从事过博士后研究;联合创始人王佳淇则长期聚焦大模型与计算生物学的交叉研究。
这种交叉结构,恰好对应了 AI Biotech 最难的环节:模型生成的结果,必须被生物学问题定义、被化学规则约束、被实验体系验证,最终还要被产业流程承接。
这支从 Baker Lab 走出的团队,也让五源资本愿意在早期下注。投资人表示,团队兼具算法能力、生命科学理解、干湿闭环能力与企业家精神,是他们愿意长期陪伴的科学创业力量。
当分子间的相互作用开始被模型统一学习、生成和验证,AI4Bio 的叙事逻辑正在发生变化。它不再仅仅是更快地发现候选分子,而是让科学家以一种更可编程的方式提出假设、生成设计、进入实验,再用真实结果反哺模型。
AlphaFold 让 AI4Bio 的第一场革命发生在“看见结构”,而英灵殿科技想挑战的,是下一步:让 AI 不仅能理解生命分子如何相互作用,还能模拟、设计微观世界的动态过程,最终走向对生命功能本身的模拟与重构。
关注“鲸栖”小程序,掌握最新AI资讯
本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/32562

