IntelliFold 2:超越AlphaFold 3,开源生物基石模型树立生成式科学智能新标杆

在生成式人工智能(GenAI)推动的“生成式科学智能”浪潮中,生物基石模型因其对生命科学的深远影响而备受瞩目。生命语言(如序列、结构)与人类语言具有相似的序列化特征,但其背后遵循着严苛的物理约束与生物演化逻辑,长期以来难以被完全解析。正因其对人类社会生产与生活的关键作用,生物基石模型被视为该领域“皇冠上的明珠”。

生物基石模型的核心价值,在于能够借助Transformer等GenAI架构,从海量生物数据中探索隐空间,发掘出人类难以直接归纳却极具应用潜力的“生命语法”。DeepMind的AlphaFold系列无疑是该领域开创性的重大突破。

AlphaFold 3的发布取得了现象级的进展,其巨大的产业潜力使之成为行业标杆。此后,全球范围内涌现出众多利用GenAI大模型在结构预测与蛋白质设计领域寻求突破的成果(如Chai Discovery、Boltz、OpenFold等),明星团队、大额融资乃至大厂并购(如Evolutionary Scale)消息频传,市场热度持续攀升。然而,直至2025年底,仍鲜有新发布的模型能在综合性能上与AlphaFold 3真正匹敌[1]。同时,受限于模型的开源程度、性能上限及部署便利性,生物基石模型的进一步普及与应用仍面临着对高性能、高可用性的迫切需求。

IntelliFold 2:超越AlphaFold 3,开源生物基石模型树立生成式科学智能新标杆

在这场全球性的激烈竞逐中,IntelliGen AI于本周末正式发布了IntelliFold 2,这是继2025年7月首版发布后的重大升级[2]。

通过对GenAI内在逻辑的创造性思考与重新设计,结合工程化模块的突破性创新,IntelliFold 2实现了在效能与功能上的全面突破。在FoldBench基准测试中,其多项关键指标超越了AlphaFold 3。尤其在抗体-抗原相互作用、蛋白质-配体共折叠等直接影响药物研发成败的关键任务上,IntelliFold 2树立了新的性能标杆,为智能药物设计提供了可控、高精度的工业级计算引擎。

核心突破:关键性能指标全面超越 AlphaFold 3

IntelliFold 2:超越AlphaFold 3,开源生物基石模型树立生成式科学智能新标杆

在生命科学领域,生物分子复合物的共折叠预测一直是核心挑战。IntelliFold 2在两项关键任务中表现卓越,超越了AlphaFold 3、Chai、Boltz等主流模型:

  • 抗体-抗原相互作用:以DockQ > 0.23为成功标准,IntelliFold 2-Pro取得了58.2%的成功率(报告的v2模型结果为5次运行平均值,最高分数达63%),显著优于AlphaFold 3的47.9%。这超过10个百分点的提升,意味着模型在抗体筛选阶段能更可靠地跨越可用性门槛,从而降低湿实验试错成本,精准锁定高潜力候选分子。
  • 蛋白质-配体共折叠:在该任务中,IntelliFold 2-Pro同样以67.7%的成功率领先于AlphaFold 3(64.9%)及Boltz等其他主流模型。这一精度的提升对于基于结构的小分子药物设计至关重要,不仅有助于提高虚拟筛选的命中率,也为后续的亲和力预测、别构靶点识别等任务奠定了坚实基础。

IntelliFold 2通过v2-Flash、v2和v2-Pro三个版本,精准覆盖了从学术研究到工业落地的多元化需求。目前,v2-Flash与v2版本已正式开源。其中,v2版本作为当前精度最高的开源模型之一,将为全球科研人员提供性能卓越的结构预测基座,大幅降低高性能生物计算的门槛。

“智能”为径,开启范式迭代:四大创新重塑新一代基座

IntelliFold 2的核心突破,源于对“信息表征能力”与“硬件计算特性”的重新思考。针对共折叠这一核心挑战,团队并未因循传统的“强数据堆砌”或单一的“专家经验注入”路径,而是寻求生命分子微观交互规律与AI计算范式的深度融合,以实现“底层模型智能”对“下游任务智能”的有效赋能。

IntelliFold 2:超越AlphaFold 3,开源生物基石模型树立生成式科学智能新标杆

  • 生物计算中的Scaling Law验证:通过隐空间扩展技术,团队扩大了PairFormer模块的特征维度,不仅增强了对复杂生物大分子相互作用的表征能力,更大幅优化了计算效率,将GPU的模型浮点运算利用率从5%提升至30%。这种算力投入带来了较高的边际效益,以可接受的时间成本,换取了复杂结构表征能力的显著提升。
  • 原子级别的精细感知:针对抗体CDR区等柔性易变结构,传统的粗粒度建模方法往往难以精确刻画。IntelliFold 2引入了随机原子级标记化方法,使模型在训练中学会捕捉细粒度的原子接触模式。这种“显微镜”级别的感知能力,弥补了宏观表征在局部细节上的缺失,成为其在抗体预测任务中领先的关键。
  • 强化学习引导的采样优化:为解决扩散模型在结构预测采样中的不稳定性,团队引入了基于PPO算法的强化学习进行优化。通过将扩散过程建模为随机策略并进行微调,IntelliFold 2有效校正了采样轨迹的偏移,减少了不准确结构的生成,从而提供了更可靠的工业级预测结果。
  • 难度感知的损失函数:针对复合物中链间距离预测等高难度区域,IntelliFold 2采用了难度感知的损失函数。通过动态调整损失权重,引导模型专注于那些容易被忽略的长尾困难区域。这种优化改善了训练收敛的稳定性,提升了模型处理复杂多链复合物时的鲁棒性。

IntelliFold 2的技术迭代体现了生成式科学研发的新范式。它不依赖于传统的专有数据注入或专家调优,也非单纯堆叠Transformer模块以增加参数量,而是基于对领域科学与模型原理的深入理解,找到有效的扩展维度,遵循智能涌现的底层逻辑,寻求稳定且可泛化的性能提升。

灵活可用:从可控预测到应用问题解决的领先实践

IntelliFold 2不仅实现了精度提升,更强调了模型的可用性。它通过通用基础模型、轻量适配器与任务引导,形成了从结构预测到功能发现的闭环推理链路。这超越了传统的单模型-单任务开发逻辑,以统一的基石模型-多任务架构,开创性地拓展了结构模型的应用场景与价值链条。该架构也允许领域科学家注入假设、约束与数据,为研究人员进行可控、精准且具有预见性的任务开发提供了创新支点。基于此次更新,IntelliFold 2在蛋白质-配体亲和力预测、别构靶点虚拟筛选等应用问题上展现出显著更优的行业应用潜力。

1. 亲和力预测(小分子)

IntelliFold 2延续了初版的高保真亲和力预测能力,不仅在PDBBind数据集上性能优于Boltz-2及其初代版本,在更接近真实产业任务的复杂内部数据集上,其亲和力预测表现也显著领先。结合其特有的别构与表位分析能力,已形成“预测结构→估计结合→指导设计”的完整闭环,并在实际案例中帮助合作伙伴在分子筛选任务上实现了效率与精度的大幅提升。

IntelliFold 2:超越AlphaFold 3,开源生物基石模型树立生成式科学智能新标杆

2. 动态捕捉靶点(别构效应)

在生命的微观世界中,蛋白质的功能并非由其静态结构决定,而是源于其在复杂能量景观中的动态构象变化。其中,别构效应是一种关键机制:在蛋白质一端施加微小扰动,即可通过构象的连锁反应,调控另一端的功能活性。这为药物研发提供了巨大潜力,但由于其高度动态性和复杂性,寻找此类药物靶点一直充满挑战。

IntelliFold 2 构建了一套协同的表征体系,兼顾“微观原子精度”与“宏观构象一致性”。在微观层面,它能以原子级分辨率捕捉氨基酸侧链的细微变化;在宏观层面,则能确保蛋白质整体拓扑结构的物理合理性。以此通用表征为基础,通过引入别构数据进行针对性微调,模型进一步掌握了解析复杂别构效应的能力。

IntelliFold 2:超越AlphaFold 3,开源生物基石模型树立生成式科学智能新标杆

得益于这一机制,IntelliFold 2 具备了在真实任务中筛选别构位点的能力,并作为其动态靶点预测功能的首个应用案例。该能力已成功帮助合作伙伴基于别构结合进行候选分子的重新筛选,在特定靶点上取得了高达67%的优秀成功率,实现了多问题全部命中,并成功推进至后续资产开发环节。

结语

在语言智能和具身智能领域,生成式人工智能浪潮正带来迅猛的变革。围绕大语言模型、自动驾驶等赛道,我们见证了全球科技的快速迭代与众多优秀成果的涌现,中国科技力量也在持续追赶甚至并驾齐驱。

然而,在关联科学前沿与生产力的“生成式科学智能”领域,尤其是在生命科学方向,情况有所不同。相较于北美市场在AlphaFold 3之后呈现的模型探索百花齐放之势,全球其他地区可直接比肩的基石模型成果仍不多见。受限于生物基石模型的高算力门槛以及对复合型人才的迫切需求,大中华区目前主要由百度、字节跳动等大型科技公司的团队在持续推进并取得阶段性进展。

IntelliFold 2 的发布,其卓越的性能表现与开源策略,无疑是一记令人振奋的回应。这表明,在生成式科学的全球竞赛中,新兴团队依然有机会加入竞争,甚至取得领先优势。

据悉,凭借强大的基石模型进展,IntelliGen AI 首个针对Binder和抗体的从头设计模型也计划于2026年中发布,旨在实现预测与生成能力的统一,进一步加速药物研发与生命科学探索的进程。

未来,围绕生物基石模型的全球竞争必将更加激烈。期待新一代的创新者能够推动“科技有效”,真正开启智能药物设计的新时代。

[1]Xu, S., Feng, Q., Qiao, L. et al. Benchmarking all-atom biomolecular structure prediction with FoldBench. Nat Commun 17, 442 (2026). https://doi.org/10.1038/s41467-025-67127-3

[2]https://github.com/IntelliGen-AI/IntelliFold


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/20738

(0)
上一篇 2026年2月7日 下午2:39
下一篇 2026年2月8日 下午6:11

相关推荐

  • RoboPocket:让普通人成为具身智能数据采集师,边采边筛提升模型训练效率

    一部手机加一个“夹爪”,随时随地采集具身智能数据 现在,只需一部手机和一个“夹爪”,就能随时随地完成具身智能数据采集。 采集到的数据质量高、可直接用于训练,并已在模型训练中验证了效果。* 模型在多步连续任务中,动作衔接更稳定。* 在真实场景中面对光照变化、环境杂乱或物体遮挡时,执行鲁棒性显著提升,更不容易失手。* 当任务目标发生小幅变化(如操作顺序调整)时,…

    2026年1月12日
    19900
  • 从数据中心到工作站:KTransformers与LLaMA-Factory联手重塑千亿参数模型微调格局

    在人工智能技术快速迭代的浪潮中,大模型微调一直被视为连接通用智能与垂直应用的关键桥梁。然而,传统微调方法对计算资源的巨额需求,将千亿乃至万亿参数模型的定制化能力牢牢锁在数据中心内部,普通研究者和中小企业只能望而却步。如今,这一局面正被彻底改写——仅需2-4张消费级RTX 4090显卡,即可在本地工作站上对DeepSeek 671B、Kimi K2 1TB等超…

    2025年11月5日
    17400
  • 华为天才少年创业:全球首个虚实融合实时交互视频模型X1,让童年幻想“滚球兽”走进现实

    还记得童年的那个愿望吗? 随着《数码宝贝》进化曲的响起,屏幕前的你我或许都曾幻想过:要是那只从数码蛋中破壳而出的滚球兽,真的可以从电视屏幕那端跳出来,就好了。 彼时,我们只能将这种天马行空的「美梦」寄希望于「次元裂缝」的开启。再后来,增强现实(AR)技术曾一度带来了希望,但几经潮起潮落,结果仍停留在「预先制作的内容叠加」层面,数字角色无法真正感知环境。 而现…

    2026年2月9日
    8400
  • 马斯克帝国整合:SpaceX、xAI、特斯拉或合并,10万亿IPO创纪录

    据彭博社报道,埃隆·马斯克(Elon Musk)旗下的三家公司——商业航天公司SpaceX、人工智能公司xAI以及电动汽车制造商特斯拉——正在考虑合并。消息传出后,美国东部时间1月29日,特斯拉股价在盘后交易中一度飙升4.5%。 ▲美国东部时间1月29日特斯拉股价变化(图源:谷歌财经) 目前讨论的核心合并方案主要有两种:其一是SpaceX与特斯拉合并;其二是…

    2026年1月30日
    19900
  • 自进化Agent突破量化因子挖掘瓶颈:QuantaAlpha框架实现27.75%年化收益

    上财团队 投稿 量子位 | 公众号 QbitAI 在量化金融的底层,Alpha因子本质上是一段可执行的代码逻辑,它们试图将嘈杂的市场数据映射为精准的交易信号。然而,长期以来,自动化因子挖掘始终被困在“两难”的夹缝中:传统的遗传规划 (Genetic Programming,GP) 虽然擅长在海量空间中进行进化搜索,但其本质是“盲目的随机变异”。 它们在回测中…

    2026年2月11日
    25100