ArcFlow:非线性流技术实现40倍推理加速,2步生成媲美原画

ArcFlow:非线性流技术实现40倍推理加速,2步生成媲美原画

图像生成领域,扩散模型通常需要数十步的迭代去噪才能生成高质量图像,这带来了高昂的计算成本,阻碍了实时应用。为了加速推理,常见的知识蒸馏方法试图将生成过程压缩到几步之内,但它们通常假设从噪声到图像的路径是一条直线,而预训练教师模型的实际生成轨迹往往是复杂的曲线。这种“几何失配”导致学生模型在几步内难以拟合,造成图像细节模糊和结构崩坏。

ArcFlow:非线性流技术实现40倍推理加速,2步生成媲美原画

ArcFlow是复旦大学与微软亚洲研究院联合提出的图像生成加速方案。它没有采用常见的线性简化策略,而是创新性地利用动量机制引入了非线性流,从而更精准地拟合教师模型的复杂生成轨迹。

ArcFlow:非线性流技术实现40倍推理加速,2步生成媲美原画

这一改进使得模型在仅需2步推理的情况下,依然能保持高度接近教师模型的画质。相比原始流程,ArcFlow实现了约40倍的推理加速和4倍的训练收敛加速;同时,该方法仅需微调极少比例的参数,对显存资源也非常友好。

ArcFlow:非线性流技术实现40倍推理加速,2步生成媲美原画

核心原理:顺势而为的“非线性”

ArcFlow的核心洞察是:既然教师模型的生成轨迹是曲线,学生模型也应该学习走曲线,而不是强行拉直。具体而言,它通过以下三大创新实现这一目标:

ArcFlow:非线性流技术实现40倍推理加速,2步生成媲美原画

1. 动量参数化:捕捉速度连续性

教师模型的去噪过程是一个连续变化的物理过程,相邻时间步之间的速度方向存在强相关性。ArcFlow引入了物理学中的动量概念,将速度场建模为多个连续动量过程的混合。通过参数化速度的演变规律,模型仅需一次计算就能外推出连贯的非线性路径,复现复杂的动态变化,消除了传统采样的计算冗余。

2. 解析求解器:实现高精度积分

基于动量公式,ArcFlow推导出了闭式解析解。这使得模型可以在单次前向传播中,直接通过数学公式计算出任意时间步的精确状态,实现了高精度流匹配,彻底消除了传统少步生成的拟合误差。

3. 轨迹蒸馏策略:高效继承教师先验

ArcFlow的非线性轨迹天然契合教师模型的生成模式。其蒸馏策略是在保留非线性特征的前提下,对瞬时速度进行对齐,从而最大程度地保留了教师模型的预训练先验知识。因此,ArcFlow无需全量微调,仅需通过LoRA等技术微调极少量参数即可快速收敛,实现了训练效率与生成质量的双重飞跃。

实验效果

ArcFlow在Qwen-Image-20B和FLUX.1-dev等大规模模型上进行了验证,结果令人印象深刻:

  • 极致速度:仅需2步即可生成高质量图像,相比原始推理加速了40倍
  • 参数高效仅需微调不到5%的参数,大大降低了训练门槛。
  • 画质优异:在多个基准测试中,ArcFlow在2步推理下的图像质量(FID)和语义一致性均优于现有的先进方法。
  • 快速收敛:训练收敛速度比基线方法快了4倍以上。

ArcFlow:非线性流技术实现40倍推理加速,2步生成媲美原画

直观对比
从效果图来看,在同样的2步推理下,其他线性蒸馏方法生成的图像容易出现背景模糊、物体结构扭曲等问题。而ArcFlow生成的图像不仅清晰度高,而且保留了教师模型原本的丰富细节画面多样性

ArcFlow:非线性流技术实现40倍推理加速,2步生成媲美原画
ArcFlow:非线性流技术实现40倍推理加速,2步生成媲美原画

总结

本研究提出的ArcFlow,是一种显式采用非线性轨迹来逼近预训练扩散教师模型复杂动态的少步蒸馏框架。通过将速度场参数化为连续动量过程的混合,ArcFlow获得了解析形式的闭式求解器,实现了精确的轨迹积分

得益于其内在的非线性特性,ArcFlow确保了与教师模型的高精度对齐,同时避免了不稳定的对抗性训练和侵入式的全参数微调,从而实现了更快的收敛速度更高效的蒸馏过程

广泛的实验表明,与线性基线方法相比,ArcFlow在使用更少可训练参数的情况下,持续实现了更优的生成质量,为未来的高效生成模型研究提供了一个极具潜力的方向。

(注:本文相关数据与图片引用自原始论文)

论文地址:https://arxiv.org/abs/2602.09014
项目代码:https://github.com/pnotp/ArcFlow


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/21658

(0)
上一篇 23小时前
下一篇 18小时前

相关推荐