图变换

万亿参数训练不再难：GraphPP用图变换彻底消除流水线气泡，加速70%

随着模型参数规模跨越万亿大关，分布式训练已演变为深度学习领域的“基础设施新范式”。然而，流水线并行在突破单张GPU显存极限的同时，也引入了一个棘手的性能杀手——“气泡”问题：GPU在等待跨阶段依赖时大量陷入空转，严重稀释了昂贵算力的实际投入。上图揭示了大模型训练中一个核心的权衡循环（Tradeoff Cycle），清晰展现了模型规模增长所引发的连锁式挑战。…

大模型训练 2小时前
17000