清华UniCardio:多模态扩散模型革新心血管监测,实现实时全面信号生成

清华UniCardio:多模态扩散模型革新心血管监测,实现实时全面信号生成

可穿戴健康监测信号由于监测难度高、观测噪声大、易受干扰,高质量的心血管信号仍难以长期便捷获取,这是智能健康监测系统始终面临的现实困境。近日,清华朱军等团队提出了一种统一的多模态生成框架 UniCardio,在单扩散模型中同时实现了心血管信号的去噪、插补与跨模态生成,为真实场景下的人工智能辅助医疗提供了一种新的解决思路。相关工作《Versatile Cardiovascular Signal Generation with a Unified Diffusion Transformer》于 2025 年 12 月 29 日在 Nature Machine Intelligence 正式上线。

心血管疾病是人类致死的主要病因之一。对个体而言,光电容积描记信号(photoplethysmography,PPG)、心电信号(electrocardiography,ECG)以及血压信号(blood pressure,BP)能够从不同侧面反映同一底层生理过程:PPG 记录皮下微血管容积变化,便于通过可穿戴设备进行连续采集;ECG 反映心肌电活动,但通常需要更严格的电极放置与专业标定;动脉 BP 则常被视为更接近临床“金标准”的血压信息来源,却往往依赖侵入式或更高负担的采集方式。

现实监测因此呈现出明显的“两难”:可穿戴信号获取便捷,却更易受到噪声、运动伪影与信号中断的影响;而高质量或更关键的信号采集,则可能带来不适、风险与成本,难以长期连续部署。

过去的研究往往将这一问题拆解为若干“单点任务”:有的方法专注于信号去噪,有的方法聚焦缺失片段补全,即从“低质量”信号重建“高质量”信号。还有的方法研究信号模态转换,即从“易测量”信号预测“难测量”信号。这些方法已在各自任务上取得了进展,但一个显著的局限在于:多数模型仍然是任务特定、模态特定,难以在同一个模型中同时覆盖多任务、多模态、多条件建模,也难以充分利用心血管信号之间天然存在的相关性与互补性。

清华UniCardio:多模态扩散模型革新心血管监测,实现实时全面信号生成

在此背景下,清华朱军等团队提出了 UniCardio,旨在以一个统一生成框架同时完成两大类核心能力:其一是信号恢复(signal restoration),包括对低质量信号的去噪以及对间断记录信号的缺失片段插补;其二是模态转换(modality translation),即在给定某些可获得信号的条件下,合成难以获取或未被记录的目标信号,从而为真实场景中的心血管监测与分析提供更完整的信号视角。

清华UniCardio:多模态扩散模型革新心血管监测,实现实时全面信号生成

方法介绍

从方法角度,UniCardio 的关键并不在于构建一个简单的“点到点映射器”,而在于将多模态心血管信号视为同一生理系统的不同观测,进而学习它们之间的多模态条件分布关系。

UniCardio 采用扩散模型“从噪声到数据”的生成范式:在前向过程中,对不同模态采用统一的噪声化机制;在反向过程中,在条件信息的引导下逐步重建目标信号,从而在同一生成框架中覆盖多种输入—输出配置。在此基础上,UniCardio 使用 Transformer 架构来建模时间维度与模态维度上的依赖关系。

为了同时处理多模态、多任务,UniCardio 为每个模态配置了模态专用的编码器与解码器,以提取和还原具有生理意义的波形特征;另一方面,在 Transformer 的注意力计算中引入任务特定注意力掩码,用于显式约束信息流,只允许与当前任务相关的条件模态到目标模态的交互,从而减少无关模态或无关方向的信息干扰,使不同任务能够在同一网络中被稳定表达与联合学习。

清华UniCardio:多模态扩散模型革新心血管监测,实现实时全面信号生成

另一个不可回避的实际困难在于:随着模态数量的增加,可用的条件组合会迅速增长。如果在训练阶段简单地将所有任务“混在一起学习”,往往会导致样本分配不足与任务权重失衡。

针对这一问题,UniCardio 引入了一种面向生成任务的持续学习(continual learning)范式:以“条件模态数逐步增加”的方式分阶段纳入不同任务,以分配足量的训练样本和平衡不同阶段任务的贡献;并结合学习率调度、训练批次组成以及注意力掩码的结构性约束,以缓解持续学习的灾难性遗忘问题。其目标是让一个统一模型在面对不断扩展的模态组合与任务配置时,依然能够保持稳健而一致的综合能力。

这种范式还带来了跨任务-模态组合的知识迁移效应:在仅涉及较少模态的生成任务上进行训练,能够有效促进模型在涉及更多模态、条件更复杂的生成任务中的表现。

清华UniCardio:多模态扩散模型革新心血管监测,实现实时全面信号生成

实验及结果

在实验结果上,UniCardio 在信号去噪、插补与跨模态转换等多模态、多功能任务中,相较于多种任务特定基线方法展现出稳定而一致的优势,并系统性地体现了多模态互补信息的价值。

论文在多项代表性任务中表明:在仅使用单一条件模态时,UniCardio 已能达到或超越相应的任务特定方法相当。而在进一步引入额外条件模态后,生成误差可显著降低,波形恢复的稳定性也随之提升。例如,在 PPG 与 ECG 插补任务中,引入多模态条件后,生成误差下降至原来的三分之一量级;在 PPG→ECG 等跨模态生成任务中,UniCardio 在参数规模远小于部分生成基线的情况下,依然取得了更优或更稳健的结果。

这些现象表明,统一建模多模态条件分布本身即可带来跨任务的知识迁移收益,而无需为每一种模态组合单独设计模型。

清华UniCardio:多模态扩散模型革新心血管监测,实现实时全面信号生成

更进一步,论文将生成信号直接用于下游心血管相关应用进行验证,包括异常状态检测与生命体征估计。

在多个未见域数据集上,基于 UniCardio 生成信号得到的下游任务性能,能够显著优于直接使用噪声或间断信号,并在多数情况下接近使用真实信号的结果。例如,在心电异常检测任务中,由 UniCardio 去噪或插补得到的 ECG 信号能够有效恢复关键诊断信息,使检测准确率与特异性大幅提升,逼近真实 ECG 信号的表现;在心率与血压估计任务中,基于生成信号的预测误差也显著低于仅使用可穿戴信号或简单统计基线的情况。

这些结果表明,UniCardio 生成的信号不仅在数值上“更像”,而且在功能层面具备直接支撑下游分析的可用性。

清华UniCardio:多模态扩散模型革新心血管监测,实现实时全面信号生成

在可解释性方面,这项工作也给出了相对临床友好的论证路径。生成结果不仅追求误差数值的降低,还尽可能保留可被临床专家识别的诊断特征。论文通过可视化展示多类典型 ECG 异常形态在生成信号中的复现情况,并结合临床评估验证其诊断特征的一致性,表明生成信号在形态层面能够与真实生理信号保持良好对齐。

此外,论文还指出,扩散模型逐步去噪的生成过程本身提供了可观察的中间状态,有助于人类专家理解信号的生成演化过程,从而进一步增强模型的可解释性与可信度。

清华UniCardio:多模态扩散模型革新心血管监测,实现实时全面信号生成

总体而言,UniCardio 将心血管信号生成从以往的单任务、单模态组合,推进到了一个更加统一且具备可扩展性的框架:通过多模态扩散 Transformer 在同一模型中覆盖信号恢复与模态转换,并借助持续学习机制来容纳不断增长的条件组合复杂度。从应用前景看,这类统一的多模态生理信号生成范式不仅有望服务于医疗健康领域中的稳健监测与辅助诊断,也可能进一步拓展到脑科学、心理学与认知科学等同样依赖多源生理信号的研究场景。

作者介绍

本论文由清华大学的朱军教授和王立元助理教授担任共同通讯作者。共同第一作者为陈泽华博士、苗雨阳博士和王立元助理教授。首都医科大学附属北京安贞医院的范泸韵博士与英国帝国理工学院的 Danilo P. Mandic 教授亦为本文的共同作者。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/16426

(0)
上一篇 2025年12月30日 上午11:47
下一篇 2025年12月30日 下午12:53

相关推荐

  • AI编程革命:当代码成本归零,8大模式重构工程师工作流

    当代码成本归零:8大模式重构工程师工作流 硅谷知名开发者、Datasette创始人Simon Willison近日发布了一份面向专业工程师的实践指南,系统阐述了如何利用Claude Code等AI编程工具提升效率。他总结了八大实战模式,旨在重构程序员在AI时代的工作方式。 代码成本的数量级跃迁 Simon Willison在开篇指出一个根本性转变:编写代码的…

    2026年3月16日
    76400
  • PostgreSQL向量检索实战解析:生产级应用还是技术炒作?

    一家电商初创公司的工程团队正面临一个典型的技术选型难题。他们的推荐系统需要实现语义搜索,以匹配用户查询与海量商品描述。团队的核心争议在于:是选择 Qdrant 或 Pinecone 这类专用向量数据库,还是采用 pgvector 扩展,将所有数据保留在 PostgreSQL 中? 这并非个例。随着 AI 驱动的搜索与 RAG(检索增强生成)系统在各行业普及,…

    2025年12月3日
    58400
  • DualCamCtrl:几何感知扩散模型革新视频生成,相机运动误差降低40%

    本研究的共同第一作者是来自香港科技大学(广州)EnVision Research 的张鸿飞(研究助理)和陈康豪(博士研究生),两位研究者均师从陈颖聪教授。 你的生成模型真的「懂几何」吗?还是只是在假装对齐相机轨迹? 当前众多视频生成模型虽宣称具备「相机运动控制」能力,但其控制信号通常仅依赖于相机位姿。虽近期工作通过逐像素射线方向(Ray Condition)…

    2025年12月21日
    38000
  • DeepSeek开源条件记忆模块:让Transformer告别“苦力活”,27B模型性能碾压MoE

    DeepSeek为Transformer引入“条件记忆”模块 DeepSeek在最新研究中为Transformer架构引入了“条件记忆”机制,旨在弥补其原生缺乏高效知识检索能力的短板。 研究团队在论文结论中明确指出:条件记忆应被视为下一代稀疏模型不可或缺的核心建模原语。 该研究由梁文锋署名,并与北京大学王选计算机研究所的赵东岩、张辉帅团队合作完成。 论文不仅…

    2026年1月13日
    54400
  • GLM-5.1-Turbo实测:开源第一模型如何用1小时开发完整应用并处理10万条数据

    GLM-5.1-Turbo 发布后不久,智谱的 Coding Plan 服务便宣布了对该模型的支持。 我随即在 Claude Code 中切换至 GLM-5.1 模型进行了深度体验。经过数日的密集测试,我发现 GLM-5.1 并非一次简单的迭代升级,其能力,尤其是在处理长程任务方面,表现出了显著的代际跨越。 根据 Artificial Analysis、SW…

    2026年4月2日
    1.3K00