IntelliFold 2:超越AlphaFold 3,开源生物基石模型树立生成式科学智能新标杆

IntelliFold 2:超越AlphaFold 3,开源生物基石模型树立生成式科学智能新标杆

在生成式人工智能(GenAI)推动的“生成式科学智能”浪潮中,生物基石模型因其对生命科学的深远影响而备受瞩目。生命语言(如序列、结构)与人类语言具有相似的序列化特征,但其背后遵循着严苛的物理约束与生物演化逻辑,长期以来难以被完全解析。正因其对人类社会生产与生活的关键作用,生物基石模型被视为该领域“皇冠上的明珠”。

生物基石模型的核心价值,在于能够借助Transformer等GenAI架构,从海量生物数据中探索隐空间,发掘出人类难以直接归纳却极具应用潜力的“生命语法”。DeepMind的AlphaFold系列无疑是该领域开创性的重大突破。

AlphaFold 3的发布取得了现象级的进展,其巨大的产业潜力使之成为行业标杆。此后,全球范围内涌现出众多利用GenAI大模型在结构预测与蛋白质设计领域寻求突破的成果(如Chai Discovery、Boltz、OpenFold等),明星团队、大额融资乃至大厂并购(如Evolutionary Scale)消息频传,市场热度持续攀升。然而,直至2025年底,仍鲜有新发布的模型能在综合性能上与AlphaFold 3真正匹敌[1]。同时,受限于模型的开源程度、性能上限及部署便利性,生物基石模型的进一步普及与应用仍面临着对高性能、高可用性的迫切需求。

IntelliFold 2:超越AlphaFold 3,开源生物基石模型树立生成式科学智能新标杆

在这场全球性的激烈竞逐中,IntelliGen AI于本周末正式发布了IntelliFold 2,这是继2025年7月首版发布后的重大升级[2]。

通过对GenAI内在逻辑的创造性思考与重新设计,结合工程化模块的突破性创新,IntelliFold 2实现了在效能与功能上的全面突破。在FoldBench基准测试中,其多项关键指标超越了AlphaFold 3。尤其在抗体-抗原相互作用、蛋白质-配体共折叠等直接影响药物研发成败的关键任务上,IntelliFold 2树立了新的性能标杆,为智能药物设计提供了可控、高精度的工业级计算引擎。

核心突破:关键性能指标全面超越 AlphaFold 3

IntelliFold 2:超越AlphaFold 3,开源生物基石模型树立生成式科学智能新标杆

在生命科学领域,生物分子复合物的共折叠预测一直是核心挑战。IntelliFold 2在两项关键任务中表现卓越,超越了AlphaFold 3、Chai、Boltz等主流模型:

  • 抗体-抗原相互作用:以DockQ > 0.23为成功标准,IntelliFold 2-Pro取得了58.2%的成功率(报告的v2模型结果为5次运行平均值,最高分数达63%),显著优于AlphaFold 3的47.9%。这超过10个百分点的提升,意味着模型在抗体筛选阶段能更可靠地跨越可用性门槛,从而降低湿实验试错成本,精准锁定高潜力候选分子。
  • 蛋白质-配体共折叠:在该任务中,IntelliFold 2-Pro同样以67.7%的成功率领先于AlphaFold 3(64.9%)及Boltz等其他主流模型。这一精度的提升对于基于结构的小分子药物设计至关重要,不仅有助于提高虚拟筛选的命中率,也为后续的亲和力预测、别构靶点识别等任务奠定了坚实基础。

IntelliFold 2通过v2-Flash、v2和v2-Pro三个版本,精准覆盖了从学术研究到工业落地的多元化需求。目前,v2-Flash与v2版本已正式开源。其中,v2版本作为当前精度最高的开源模型之一,将为全球科研人员提供性能卓越的结构预测基座,大幅降低高性能生物计算的门槛。

“智能”为径,开启范式迭代:四大创新重塑新一代基座

IntelliFold 2的核心突破,源于对“信息表征能力”与“硬件计算特性”的重新思考。针对共折叠这一核心挑战,团队并未因循传统的“强数据堆砌”或单一的“专家经验注入”路径,而是寻求生命分子微观交互规律与AI计算范式的深度融合,以实现“底层模型智能”对“下游任务智能”的有效赋能。

IntelliFold 2:超越AlphaFold 3,开源生物基石模型树立生成式科学智能新标杆

  • 生物计算中的Scaling Law验证:通过隐空间扩展技术,团队扩大了PairFormer模块的特征维度,不仅增强了对复杂生物大分子相互作用的表征能力,更大幅优化了计算效率,将GPU的模型浮点运算利用率从5%提升至30%。这种算力投入带来了较高的边际效益,以可接受的时间成本,换取了复杂结构表征能力的显著提升。
  • 原子级别的精细感知:针对抗体CDR区等柔性易变结构,传统的粗粒度建模方法往往难以精确刻画。IntelliFold 2引入了随机原子级标记化方法,使模型在训练中学会捕捉细粒度的原子接触模式。这种“显微镜”级别的感知能力,弥补了宏观表征在局部细节上的缺失,成为其在抗体预测任务中领先的关键。
  • 强化学习引导的采样优化:为解决扩散模型在结构预测采样中的不稳定性,团队引入了基于PPO算法的强化学习进行优化。通过将扩散过程建模为随机策略并进行微调,IntelliFold 2有效校正了采样轨迹的偏移,减少了不准确结构的生成,从而提供了更可靠的工业级预测结果。
  • 难度感知的损失函数:针对复合物中链间距离预测等高难度区域,IntelliFold 2采用了难度感知的损失函数。通过动态调整损失权重,引导模型专注于那些容易被忽略的长尾困难区域。这种优化改善了训练收敛的稳定性,提升了模型处理复杂多链复合物时的鲁棒性。

IntelliFold 2的技术迭代体现了生成式科学研发的新范式。它不依赖于传统的专有数据注入或专家调优,也非单纯堆叠Transformer模块以增加参数量,而是基于对领域科学与模型原理的深入理解,找到有效的扩展维度,遵循智能涌现的底层逻辑,寻求稳定且可泛化的性能提升。

灵活可用:从可控预测到应用问题解决的领先实践

IntelliFold 2不仅实现了精度提升,更强调了模型的可用性。它通过通用基础模型、轻量适配器与任务引导,形成了从结构预测到功能发现的闭环推理链路。这超越了传统的单模型-单任务开发逻辑,以统一的基石模型-多任务架构,开创性地拓展了结构模型的应用场景与价值链条。该架构也允许领域科学家注入假设、约束与数据,为研究人员进行可控、精准且具有预见性的任务开发提供了创新支点。基于此次更新,IntelliFold 2在蛋白质-配体亲和力预测、别构靶点虚拟筛选等应用问题上展现出显著更优的行业应用潜力。

1. 亲和力预测(小分子)

IntelliFold 2延续了初版的高保真亲和力预测能力,不仅在PDBBind数据集上性能优于Boltz-2及其初代版本,在更接近真实产业任务的复杂内部数据集上,其亲和力预测表现也显著领先。结合其特有的别构与表位分析能力,已形成“预测结构→估计结合→指导设计”的完整闭环,并在实际案例中帮助合作伙伴在分子筛选任务上实现了效率与精度的大幅提升。

IntelliFold 2:超越AlphaFold 3,开源生物基石模型树立生成式科学智能新标杆

2. 动态捕捉靶点(别构效应)

在生命的微观世界中,蛋白质的功能并非由其静态结构决定,而是源于其在复杂能量景观中的动态构象变化。其中,别构效应是一种关键机制:在蛋白质一端施加微小扰动,即可通过构象的连锁反应,调控另一端的功能活性。这为药物研发提供了巨大潜力,但由于其高度动态性和复杂性,寻找此类药物靶点一直充满挑战。

IntelliFold 2 构建了一套协同的表征体系,兼顾“微观原子精度”与“宏观构象一致性”。在微观层面,它能以原子级分辨率捕捉氨基酸侧链的细微变化;在宏观层面,则能确保蛋白质整体拓扑结构的物理合理性。以此通用表征为基础,通过引入别构数据进行针对性微调,模型进一步掌握了解析复杂别构效应的能力。

IntelliFold 2:超越AlphaFold 3,开源生物基石模型树立生成式科学智能新标杆

得益于这一机制,IntelliFold 2 具备了在真实任务中筛选别构位点的能力,并作为其动态靶点预测功能的首个应用案例。该能力已成功帮助合作伙伴基于别构结合进行候选分子的重新筛选,在特定靶点上取得了高达67%的优秀成功率,实现了多问题全部命中,并成功推进至后续资产开发环节。

结语

在语言智能和具身智能领域,生成式人工智能浪潮正带来迅猛的变革。围绕大语言模型、自动驾驶等赛道,我们见证了全球科技的快速迭代与众多优秀成果的涌现,中国科技力量也在持续追赶甚至并驾齐驱。

然而,在关联科学前沿与生产力的“生成式科学智能”领域,尤其是在生命科学方向,情况有所不同。相较于北美市场在AlphaFold 3之后呈现的模型探索百花齐放之势,全球其他地区可直接比肩的基石模型成果仍不多见。受限于生物基石模型的高算力门槛以及对复合型人才的迫切需求,大中华区目前主要由百度、字节跳动等大型科技公司的团队在持续推进并取得阶段性进展。

IntelliFold 2 的发布,其卓越的性能表现与开源策略,无疑是一记令人振奋的回应。这表明,在生成式科学的全球竞赛中,新兴团队依然有机会加入竞争,甚至取得领先优势。

据悉,凭借强大的基石模型进展,IntelliGen AI 首个针对Binder和抗体的从头设计模型也计划于2026年中发布,旨在实现预测与生成能力的统一,进一步加速药物研发与生命科学探索的进程。

未来,围绕生物基石模型的全球竞争必将更加激烈。期待新一代的创新者能够推动“科技有效”,真正开启智能药物设计的新时代。

[1]Xu, S., Feng, Q., Qiao, L. et al. Benchmarking all-atom biomolecular structure prediction with FoldBench. Nat Commun 17, 442 (2026). https://doi.org/10.1038/s41467-025-67127-3

[2]https://github.com/IntelliGen-AI/IntelliFold


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/20738

(0)
上一篇 5天前
下一篇 4天前

相关推荐

  • 四大前沿AI开源项目盘点:从智能体编排到浏览器自动化,加速你的开发效率

    Claude Code 的开源外挂 Agents 是一个专为 Claude Code 设计的智能自动化和多智能体编排系统。借助该项目,开发者可以构建一个由不同 AI 专家组成的协作团队,而非仅依赖单一的 AI 助手。 该系统集成了丰富的资源,例如 63 个插件、85 个智能体以及 47 项技能: 该项目的一个核心优势在于其极致的 Token 效率与混合模型编…

    2025年12月14日
    14400
  • DeepSeek-Math-V2震撼开源:685B巨无霸模型登顶数学推理巅峰,IMO金牌水平+Putnam近乎满分

    刚刚,DeepSeek 开源了最新的数学推理模型 DeepSeek-Math-V2。 这不仅仅是一次普通的模型迭代,根据在国际数学奥林匹克和普特南数学竞赛上的表现来看,这可能是开源模型在数学推理领域的一个里程碑时刻。 数学推理新王登基了。 如果说上一代 DeepSeek-Math 让我们看到了开源模型在数学领域的潜力,那么这一次 V2 版本交出了一份令人咋舌…

    2025年11月28日
    10400
  • 昆仑天工SkyReels-V3开源:多模态视频生成新标杆,开启AI创作新纪元

    昆仑天工开源SkyReels-V3:多模态视频生成模型实现技术突破 近日,昆仑天工正式宣布开源其多模态视频生成模型 SkyReels-V3。该模型在文生视频、图生视频、视频延长及虚拟形象生成等多个维度展现出强大能力,致力于解决AI生成视频内容在真实性、连贯性与物理合理性方面的长期挑战。 多模态生成能力实测 SkyReels-V3支持从图像生成动态视频。以下测…

    2026年1月29日
    6100
  • 腾讯混元开源HY3D-Bench:构建3D生成领域的“ImageNet”,破解数据与评估瓶颈

    3D生成技术如今在可用性上已达到令人惊艳的程度。 然而,数据质量参差不齐、评估标准缺失以及长尾类别覆盖不足这三大痛点,依然困扰着该领域的研究者。 针对这些问题,腾讯混元3D团队在最新技术报告《HY3D-Bench: Generation of 3D Assets》中,正式开源了一套革命性的3D内容生成生态系统。 该工作通过自动化数据清洗流水线,从Objave…

    6天前
    1500
  • 30秒极速部署:PinMe开源神器让静态网站上线零门槛

    在 AI 生成 HTML 页面成本极低的今天,快速部署与分享静态网站的需求日益凸显。PinMe 是一个能够将静态网站极速、免费部署上线的开源项目,无论是 AI 生成的单页,还是 Vue、React 等框架构建的项目,都能轻松应对。 开源项目介绍 PinMe 是一个静态网站一键部署工具,它能将你的网站文件快速发布到线上,生成一个可分享的永久链接。其核心原理是利…

    2025年11月18日
    9600