打破模态孤岛:全模态分子设计基座模型ODesign,让AI像设计语言一样设计分子

过去几年,AI4Bio领域最令人印象深刻的进展,莫过于Google DeepMind推出的AlphaFold。这项技术让AI能够大规模且接近实验精度地“洞察”蛋白质的三维结构。到了AlphaFold 3时代,AI甚至开始深入理解由蛋白质、核酸、小分子和离子构成的多组分复合体。

然而,生命工程真正追求的目标,远不止于“观察”。它渴望的是“设计”——设计一个分子,使其能够在正确的位置、以正确的方式与目标相互作用,从而调控信号通路、改变病理过程,甚至重塑某种生命功能。

打破模态孤岛:全模态分子设计基座模型ODesign,让AI像设计语言一样设计分子

以核糖体为例,它不仅是蛋白质、RNA与小分子药物协同作用的分子机器,也是众多小分子药物的作用靶点。

这正是当前AI分子设计所面临的核心瓶颈。

过去的AI分子设计并非毫无建树,但许多能力仍被困在“模态孤岛”之中:蛋白质设计、小分子生成与分子对接、核酸结构建模,这些领域长期各自为政,互不联通。

注:此处“模态”并非指文本、图像或音频,而是指蛋白质、小分子、核酸等不同类别的生命分子,它们可被视为不同类型的“Token”。

这并非模型数量的问题,而是在表征方式、训练数据和任务目标被割裂后,AI很难在同一套框架内连续地理解和设计跨模态的相互作用。

然而,真实的生命系统从不遵循这些人为划定的边界。在一个靶点场景中,多模态共存是常态。疾病的发生机制,往往取决于分子之间如何识别、结合、调控以及失衡。

既然生命问题天然具有跨模态属性,为什么分子设计模型还要被模态的边界所限制?

从全模态分子设计
迈向分子世界模型

“物理学中存在四种基本相互作用力。在这个框架下,生物分子之间的相互作用,本质上都可以理解为电磁相互作用的不同阶展开。” 这意味着,蛋白质、核酸、小分子等标签,只是人类为了理解生命系统而设定的分类;但在更底层的原子尺度上,分子之间遵循着统一的物理相互作用规律。

既然底层物理规律是统一的,那么学习分子相互作用的AI,也不应该被模态标签所束缚。

这套极具穿透力的底层逻辑,出自一位“很不单模态”的年轻科学家——张昊天。

张昊天在本科阶段同时修读了浙江大学的物理学与药学专业,随后获得浙江大学医学硕士学位,并前往华盛顿大学继续从事计算机方向的研究。从物理的底层规律、医学的生命表象,到计算机的建模推演,张昊天本人的学术轨迹,本身就是对“打破边界”这一理念最生动的诠释。

这种交叉学科背景,使他既能从原子尺度理解分子间的相互作用,也能从模型视角重新构建分子设计问题。

此前,由张昊天作为第一作者兼共同通讯作者,在临港实验室联合上海浦江实验室、华盛顿大学、哈佛大学、MIT等科研力量共同推进的ODesign开源科研项目,被定位为全球首个面向全模态的分子设计基座模型。

打破模态孤岛:全模态分子设计基座模型ODesign,让AI像设计语言一样设计分子

  • 论文地址:https://odesign1.github.io/static/pdfs/technical_report.pdf
  • 试用地址:https://odesign.lglab.ac.cn/

ODesign试图将蛋白质、DNA、RNA、小分子与离子等多模态实体纳入同一套生成框架,让AI学习它们之间的相互作用,并在分子整体、功能基序、提示原子三种粒度下,实现任意两类分子之间的可控设计。

在张昊天看来,该项目要证明的并非“一个模型能多做几类任务”,而是一个更根本的问题:如果生命分子的相互作用本质上是跨模态的,那么模型也必须具备跨模态学习和生成的能力。否则,任何单一模态的建模,本质上都是在用一个被截断的世界去近似真实系统,最终只能依赖大规模筛选来弥补建模能力的不足。因此,基于研究团队在分子设计模型上的研究基础与长期积累,ODesign尝试在这一方向上做出探索:在同一生成框架下,对蛋白质、DNA、RNA、小分子与离子等不同模态进行统一表示,使模型能够在一定程度上学习它们之间的相互作用,并支持跨模态的联合建模与设计。

打破模态孤岛:全模态分子设计基座模型ODesign,让AI像设计语言一样设计分子

ODesign全模态生成框架示意图。ODesign将蛋白、DNA、RNA、小分子与离子纳入同一生成框架,支持不同分子类型之间的all-to-all设计,并可在刚性或柔性靶标条件下生成目标结合分子。来源:《ODesign: A World Model for Biomolecular Interaction Design》

支撑这一宏大愿景的,是一支“从2024诺贝尔化学奖实验室走出来”的年轻科学家团队。2024年,David Baker因“计算蛋白设计”荣获诺贝尔化学奖。ODesign项目组的核心成员——张昊天、应可钧、王佳淇——均来自Baker Lab。该团队同时具备前沿AI建模能力、计算蛋白设计训练背景以及干湿闭环理解,是国内少数真正站在AI4Science与生命分子设计交叉点的团队。

统一表征与涌现
世界模型的雏形

跨模态的理念,必须在工程上落地为统一的表征。

ODesign面临的第一个难题是:蛋白质、小分子、核酸的结构差异巨大,如何让同一套模型真正“读懂”不同的分子?

研究团队的思路,是寻找不同模态之间可以共享的“最小化学生成单元”(MCGU)。模型不再将蛋白质、小分子、核酸视为割裂的对象,而是先将其拆解到统一的化学基元层面,再通过Modality Token和Unit Token进行表征。推理时,模型先围绕共享基元生成,再补齐不同模态特有的原子信息。

打破模态孤岛:全模态分子设计基座模型ODesign,让AI像设计语言一样设计分子

ODesign的统一表征架构。模型将不同分子类型的最小化学生成单元抽象为统一token,并通过Pairformer学习其与目标结构之间的相互作用,再由全原子扩散模块生成满足空间约束的三维结构。

这不仅是工程技巧,更是实现跨模态迁移的前提:只有在表征层打通壁垒,模型才能学到超越单一分子类型的通用互作规律,找到一种统一的“分子语言”。

在此基础上,ODesign还构建了一套以结构预测为基础的生成式架构。团队先训练结构预测框架,再重构信息流和目标函数,让模型从“预测这些分子会形成什么结构”,转向“生成一个能按预期发生作用的新分子”。前者是理解结构,后者是设计关系。

那么,这种统一表征是否真的带来了新能力?

目前的验证结果显示,ODesign的价值不仅在于“一个模型能做更多任务”,更在于它展现了在不同模态之间的迁移能力。

在蛋白质设计上,ODesign首先证明了自己的实力。其计算通量相比RFDiffusion提升了约10倍,在RFDiffusion2的AME测试集上,ODesign-Flex实现了相较于RFDiffusion2高达20倍的设计候选通量提升。

更关键的验证体现在低数据模态——核酸上。相比蛋白质,核酸的数据量更少,成熟模型也更少。ODesign在RNA单体设计上的成功率约为RNAFrameFlow的两倍;在训练集外的蛋白-RNA复合体零样本设计中,平均成功率达到77.9%。这表明它绝非“披着全模态外衣的蛋白质模型”,而是真正将蛋白质场景中学到的互作规律,迁移到了RNA、DNA等低数据模态。

打破模态孤岛:全模态分子设计基座模型ODesign,让AI像设计语言一样设计分子

ODesign在核酸设计任务中的跨模态迁移验证。在RNA/DNA单体生成与蛋白结合aptamer设计中,ODesign展现出向低数据核酸模态迁移互作规律的能力,其中protein-binding RNA任务体现了其零样本设计潜力。

小分子则更贴近药物研发场景。ODesign在蛋白结合小分子任务上,性能较SurfGen提升了超过40倍,并覆盖了DNA/RNA结合小分子设计。这不再是旧任务上的刷分,而是触及了传统小分子模型无法处理的盲区。

打破模态孤岛:全模态分子设计基座模型ODesign,让AI像设计语言一样设计分子

ODesign在小分子设计任务中的表现。在蛋白、DNA、RNA结合小分子设计中,ODesign展现出跨靶标类型生成小分子的能力,开始覆盖传统专家模型更难处理的跨模态设计组合。

在计算指标之外,最终的评价标准仍然是湿实验——即在真实的生物实验体系中进行检测、筛选与确认。

据张昊天介绍,ODesign 已在 8 个靶点上获得了从 nM 级到 pM 级亲和力的候选分子。与 RFDiffusion、BindCraft、BoltzGen、PXDesign 等方法相比,ODesign 在蛋白质设计(protein design)任务中,将结合亲和力(binding affinity)提升了数倍至数百倍。这标志着 ODesign 已真正进入生物实验验证阶段。

统一生成、跨模态迁移与实验验证的闭环打通,正是“分子世界模型雏形”的核心价值所在。它证明模型终于跨越了模态边界,开始学习分子世界更深层的相互作用规律。

从基座到闭环:重构科学发现的基础设施

然而,作为一个开源科研型项目,ODesign 对团队而言远非终点。作为原型机,它验证了统一生成与跨模态迁移的可行性,但距离一个真正的微观分子世界模型仍有差距。此外,它尚未被封装为可规模化、可验证、可容错的产业工具。真正的挑战在于:如何从一个能生成分子的模型,进化为一个能参与真实药物研发全流程的系统。

为解决这一问题,张昊天决定独立创业,联合应可钧、王佳淇等志同道合的伙伴,共同创立了英灵殿科技,并完成了由五源资本领投的首轮融资。

张昊天团队从技术路径出发,将这条道路拆解为三个清晰的台阶:AI4Bio、AI4AI 与 AI4Phy。

短期来看,AI4Bio 是商业化入口,从真实的生物分子设计任务切入,服务于药企和科研机构。在真实的药物研发中,模型不能只看结合力,还必须应对毒性、渗透性、免疫原性、可合成性等多重约束。

中期来看,AI4AI 指向自我迭代的科学智能框架。

当前,AI4Science 面临一个现实困境:许多模型能刷新 Benchmark,却难以真正说服客户。问题不仅在于结果不够好,更在于模型输出往往仍是黑箱——它为什么这样设计?依据是什么?失败后该如何调整?

AI4AI 试图解决的正是这一问题。它将非结构化文献、实验数据和模型输出整合为可导航的知识拓扑,让模型不仅能给出答案,还能围绕假设提出、归因评估和结果优化进行持续推理。

再往后,则是 AI4Phy,即自驱动实验室。

模型生成候选分子,实验系统完成合成、纯化、测试,结果再反馈回模型,推动下一轮设计。这一循环一旦建立,模型就不再仅仅依赖历史数据,而是在真实反馈中不断自我校正。

这正是分子世界模型与普通生成模型拉开差距的地方。

普通生成模型能给出候选方案,而世界模型需要理解的是:一个分子设计进入真实物理世界后,会发生什么、失败在哪里、又该如何修正。

要做到这一点,比拼的就不只是模型能力,而是团队能否同时理解科学问题、实验反馈与产业流程。

这也是英灵殿团队结构值得关注的原因。张昊天横跨物理、药学、医学与计算机领域;CTO 应可钧拥有哈佛生物医学与计算机背景,并在斯坦福医学院和 Baker Lab 从事过博士后研究;联合创始人王佳淇则长期聚焦大模型与计算生物学的交叉研究。

这种交叉结构,恰好对应了 AI Biotech 最难的环节:模型生成的结果,必须被生物学问题定义、被化学规则约束、被实验体系验证,最终还要被产业流程承接。

这支从 Baker Lab 走出的团队,也让五源资本愿意在早期下注。投资人表示,团队兼具算法能力、生命科学理解、干湿闭环能力与企业家精神,是他们愿意长期陪伴的科学创业力量。

当分子间的相互作用开始被模型统一学习、生成和验证,AI4Bio 的叙事逻辑正在发生变化。它不再仅仅是更快地发现候选分子,而是让科学家以一种更可编程的方式提出假设、生成设计、进入实验,再用真实结果反哺模型。

AlphaFold 让 AI4Bio 的第一场革命发生在“看见结构”,而英灵殿科技想挑战的,是下一步:让 AI 不仅能理解生命分子如何相互作用,还能模拟、设计微观世界的动态过程,最终走向对生命功能本身的模拟与重构。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/32562

(0)
上一篇 2小时前
下一篇 2小时前

相关推荐

  • 硅谷异类:7人团队打造千万用户笔记软件,拒绝资本、无会议文化成就商业奇迹

    许多长期与文字和代码打交道的创作者,对 Obsidian 这款软件并不陌生。作为目前全球最具影响力的本地化 Markdown 笔记应用之一,它凭借独树一帜的知识图谱和开源生态,在知名度与用户忠诚度上,已能与 Notion 分庭抗礼。 最近,Obsidian 官方的一条招聘推文引发了广泛关注与讨论。 令人惊讶的是,这家估值不菲的公司的核心工程师团队仅有 3 人…

    2026年4月7日
    24100
  • GitHub 六大 Agent 开源项目:从零构建智能体,打破信息壁垒

    2025年,无疑是Agent(智能体)元年,GitHub作为重要的学习平台,汇聚了大量优质的开源教程与项目。 01 Hello-Agents 这是由国内社区Datawhale开源的教程,在GitHub上已获得5700+ Star。该教程不仅深入讲解底层原理,更注重实践,手把手指导你编写可运行的Agent代码。它不仅仅是一个代码仓库,更像一本互动式的教科书,旨…

    2025年12月9日
    1.4K00
  • nncase:基于e-graph的端到端LLM编译器,突破异构存储架构性能瓶颈

    关键词:LLM 编译、 e-graph、异构存储架构、统一分布式编译、自动优化、端到端编译框架 本文转载自知乎账号:郑启航[1] 原文链接:https://zhuanlan.zhihu.com/p/1989088940733510928 nncase: An End-to-End Compiler for Efficient LLM Deployment o…

    2025年12月30日
    40800
  • 蚂蚁灵波开源300万对RGB-D数据集,破解空间智能数据瓶颈

    蚂蚁灵波开源300万对RGB-D数据集,破解空间智能数据瓶颈 什么在限制空间智能的落地? 从自动驾驶到具身智能,行业共识指向一个核心要素:数据。数据不足导致模型泛化能力弱,往往只能依赖硬件堆叠来弥补。 这一挑战在机器人领域尤为突出。机器人依赖RGB-D相机来感知三维空间,这类设备能同时获取RGB图像和深度信息。然而,当遇到镜子、电梯门、玻璃等透明或高反光物体…

    2026年3月31日
    25500
  • 30秒极速部署:PinMe开源神器让静态网站上线零门槛

    在 AI 生成 HTML 页面成本极低的今天,快速部署与分享静态网站的需求日益凸显。PinMe 是一个能够将静态网站极速、免费部署上线的开源项目,无论是 AI 生成的单页,还是 Vue、React 等框架构建的项目,都能轻松应对。 开源项目介绍 PinMe 是一个静态网站一键部署工具,它能将你的网站文件快速发布到线上,生成一个可分享的永久链接。其核心原理是利…

    2025年11月18日
    27700