摩尔线程LiteGS开源：以全栈协同优化攻克3DGS训练瓶颈，为具身智能提供高效三维建模引擎

2025年12月，在香港举办的SIGGRAPH Asia 2025大会上，一场聚焦3D Gaussian Splatting（3DGS）重建技术的国际挑战赛结果揭晓。中国芯片与计算公司摩尔线程凭借其自研的3DGS基础库LiteGS，在3DGS重建挑战赛中脱颖而出，荣获银奖。这一成绩不仅是对其算法与工程能力的认可，更标志着国产计算技术在神经渲染这一前沿领域已具备国际竞争力。

3DGS，即三维高斯溅射，自2023年提出以来，已成为计算机图形学与视觉领域的一场范式革命。它通过使用数百万个可参数化的三维高斯椭球（称为“高斯基元”）来表示场景，实现了渲染质量、速度与资源消耗之间的卓越平衡。与传统神经辐射场（NeRF）技术相比，3DGS能在保持甚至提升视觉保真度的同时，将新视角的渲染速度提升数百至上千倍，达到实时交互的水平。这种突破性进展，使其迅速在虚拟现实（VR）、增强现实（AR）、数字孪生、自动驾驶仿真等需要高质量实时三维可视化的领域获得广泛应用前景。

然而，3DGS技术从“可用”到“好用”，仍面临一个核心瓶颈：尽管其渲染（推理）速度极快，但模型的训练（优化）过程却异常耗时。一个高质量3DGS模型的训练通常需要数十分钟甚至数小时，这严重制约了其在需要快速迭代或实时重建场景（如机器人交互、即时AR内容创建）中的实用化进程。现有优化方案多从算法或硬件单一方面入手，缺乏系统性的全栈协同设计，难以从根本上突破性能天花板。

正是在此背景下，摩尔线程LiteGS的价值得以凸显。本次SIGGRAPH Asia的3DGS重建挑战赛设置了严苛的实用化导向任务：参赛者需在60秒内，仅凭一段10-30秒的真实终端视频、存在误差的相机轨迹以及终端SLAM（同步定位与地图构建）点云，完成高质量的3DGS重建。竞赛以峰值信噪比（PSNR，衡量重建质量）和重建总耗时作为核心评价指标。摩尔线程AI团队（参赛编号MT-AI）交出的答卷令人瞩目：在平均PSNR达到27.58（位列前三）的高质量前提下，其重建总耗时仅需34秒，显著领先于多数参赛队伍，最终斩获银奖。这一成绩直观证明了LiteGS在精度与效率之间取得的极致平衡。

摩尔线程实现这一突破的关键，在于其首次实现了从底层GPU系统、中层数据管理到高层算法设计的全链路协同优化，而非局部修补。具体而言，LiteGS的创新体系体现在三个层面：

在**GPU系统与计算范式**层面，LiteGS创新性地提出了基于“One Warp Per Tile”原则的“Warp-Based Raster”光栅化新范式。它将传统复杂的梯度聚合计算简化为一次Warp（GPU线程束）内的归约操作，并结合扫描线算法与混合精度策略，大幅降低了梯度计算的开销，同时实现了高效的像素级统计，为上层算法提供了强有力的底层支撑。

在**数据管理与调度**层面，面对3DGS中数以百万计、空间分布稀疏的高斯基元，LiteGS引入了一套“聚类-剔除-压缩”的智能流水线。它利用Morton编码对高斯基元进行动态的空间重排，以极低开销显著提升了数据访问的局部性，从而有效减少了GPU缓存失效和Warp执行路径的分化，确保了计算单元的高效利用。

在**核心算法设计**层面，LiteGS摒弃了原有方案中较为模糊的致密化（Densification）度量指标，转而采用更为鲁棒的像素不透明度梯度方差作为核心判据。这一改进能够更精准地识别场景中的欠拟合区域，指导高斯基元的自适应增删，其轻量化的计算过程直接受益于底层新型光栅化器提供的高效统计能力，形成了算法与系统间的正向循环。

这种全栈协同优化的威力，通过详实的性能数据得以验证。在达到与当前质量最优开源方案同等PSNR水平时，LiteGS能实现高达10.8倍的训练加速，同时模型参数量减少一半以上，显著降低了存储与传输开销。在控制参数量相同的情况下，LiteGS的PSNR指标能超出主流方案0.2-0.4 dB，而训练时间则缩短了3.8至7倍。尤为突出的是，在面向轻量化、高效率的应用场景时，LiteGS仅需原版3DGS约10%的训练时间与20%的参数量，即可实现同等的渲染质量。这为其在资源受限的边缘设备或对延迟极度敏感的应用中部署扫清了障碍。

LiteGS的技术突破，对于正处爆发前夜的**具身智能（Embodied AI）** 领域具有深远意义。具身智能要求智能体（如机器人）能够理解并与复杂的物理环境进行实时、安全的交互。其核心挑战之一在于如何快速、准确地构建并更新对周围世界的三维认知模型。传统基于点云或体素的方法在精度或效率上往往难以兼顾。3DGS技术凭借其高保真、轻量级和快速渲染的特性，为构建作为智能体“眼睛”和“大脑”基础的世界模型提供了理想的技术路径。LiteGS通过攻克训练瓶颈，使得快速从机器人第一视角视频流中重建出可用于路径规划、物体操纵和场景理解的高质量三维环境成为可能，从而加速了具身智能从实验室走向实际应用的进程。

摩尔线程此次将LiteGS在GitHub平台全面开源，其意义远超一次竞赛的胜利或单个项目的发布。这首先体现了其“以全栈能力赋能产业”的技术战略。从自研GPU硬件到深度优化的系统软件，再到顶层的核心算法库，摩尔线程正在构建一个从硅到软件、再到应用场景的完整计算生态。其次，这为全球3DGS研究社区与产业界提供了一个高性能的基准实现与开发平台，有望吸引更多开发者共同推动神经渲染技术的演进。最后，这也向国际市场展示了中国科技公司在底层基础软件与前沿交叉学科（图形学x人工智能）上日益增强的创新实力与工程化能力。

展望未来，随着3DGS及其优化技术如LiteGS的成熟，我们有望看到其在更多领域开花结果：从电影游戏的高效内容制作，到工业设计的实时数字样机评审；从元宇宙中栩栩如生的虚拟场景构建，到智慧城市高精度数字孪生的动态更新。而作为底层使能技术，高效的三维感知与建模能力，无疑是人工智能迈向“理解并操作真实物理世界”这一终极目标的关键阶梯。摩尔线程LiteGS的开源，正是为攀登这一阶梯递上了一把经过精心锻造的“神兵利器”。