摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

2025年12月,在香港举办的SIGGRAPH Asia 2025大会上,一场聚焦3D Gaussian Splatting(3DGS)重建技术的国际挑战赛结果揭晓。中国芯片与计算公司摩尔线程凭借其自研的3DGS基础库LiteGS,在3DGS重建挑战赛中脱颖而出,荣获银奖。这一成绩不仅是对其算法与工程能力的认可,更标志着国产计算技术在神经渲染这一前沿领域已具备国际竞争力。

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

3DGS,即三维高斯溅射,自2023年提出以来,已成为计算机图形学与视觉领域的一场范式革命。它通过使用数百万个可参数化的三维高斯椭球(称为“高斯基元”)来表示场景,实现了渲染质量、速度与资源消耗之间的卓越平衡。与传统神经辐射场(NeRF)技术相比,3DGS能在保持甚至提升视觉保真度的同时,将新视角的渲染速度提升数百至上千倍,达到实时交互的水平。这种突破性进展,使其迅速在虚拟现实(VR)、增强现实(AR)、数字孪生、自动驾驶仿真等需要高质量实时三维可视化的领域获得广泛应用前景。

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

然而,3DGS技术从“可用”到“好用”,仍面临一个核心瓶颈:尽管其渲染(推理)速度极快,但模型的训练(优化)过程却异常耗时。一个高质量3DGS模型的训练通常需要数十分钟甚至数小时,这严重制约了其在需要快速迭代或实时重建场景(如机器人交互、即时AR内容创建)中的实用化进程。现有优化方案多从算法或硬件单一方面入手,缺乏系统性的全栈协同设计,难以从根本上突破性能天花板。

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

正是在此背景下,摩尔线程LiteGS的价值得以凸显。本次SIGGRAPH Asia的3DGS重建挑战赛设置了严苛的实用化导向任务:参赛者需在60秒内,仅凭一段10-30秒的真实终端视频、存在误差的相机轨迹以及终端SLAM(同步定位与地图构建)点云,完成高质量的3DGS重建。竞赛以峰值信噪比(PSNR,衡量重建质量)和重建总耗时作为核心评价指标。摩尔线程AI团队(参赛编号MT-AI)交出的答卷令人瞩目:在平均PSNR达到27.58(位列前三)的高质量前提下,其重建总耗时仅需34秒,显著领先于多数参赛队伍,最终斩获银奖。这一成绩直观证明了LiteGS在精度与效率之间取得的极致平衡。

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

摩尔线程实现这一突破的关键,在于其首次实现了从底层GPU系统、中层数据管理到高层算法设计的全链路协同优化,而非局部修补。具体而言,LiteGS的创新体系体现在三个层面:

在**GPU系统与计算范式**层面,LiteGS创新性地提出了基于“One Warp Per Tile”原则的“Warp-Based Raster”光栅化新范式。它将传统复杂的梯度聚合计算简化为一次Warp(GPU线程束)内的归约操作,并结合扫描线算法与混合精度策略,大幅降低了梯度计算的开销,同时实现了高效的像素级统计,为上层算法提供了强有力的底层支撑。

在**数据管理与调度**层面,面对3DGS中数以百万计、空间分布稀疏的高斯基元,LiteGS引入了一套“聚类-剔除-压缩”的智能流水线。它利用Morton编码对高斯基元进行动态的空间重排,以极低开销显著提升了数据访问的局部性,从而有效减少了GPU缓存失效和Warp执行路径的分化,确保了计算单元的高效利用。

在**核心算法设计**层面,LiteGS摒弃了原有方案中较为模糊的致密化(Densification)度量指标,转而采用更为鲁棒的像素不透明度梯度方差作为核心判据。这一改进能够更精准地识别场景中的欠拟合区域,指导高斯基元的自适应增删,其轻量化的计算过程直接受益于底层新型光栅化器提供的高效统计能力,形成了算法与系统间的正向循环。

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

这种全栈协同优化的威力,通过详实的性能数据得以验证。在达到与当前质量最优开源方案同等PSNR水平时,LiteGS能实现高达10.8倍的训练加速,同时模型参数量减少一半以上,显著降低了存储与传输开销。在控制参数量相同的情况下,LiteGS的PSNR指标能超出主流方案0.2-0.4 dB,而训练时间则缩短了3.8至7倍。尤为突出的是,在面向轻量化、高效率的应用场景时,LiteGS仅需原版3DGS约10%的训练时间与20%的参数量,即可实现同等的渲染质量。这为其在资源受限的边缘设备或对延迟极度敏感的应用中部署扫清了障碍。

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

LiteGS的技术突破,对于正处爆发前夜的**具身智能(Embodied AI)** 领域具有深远意义。具身智能要求智能体(如机器人)能够理解并与复杂的物理环境进行实时、安全的交互。其核心挑战之一在于如何快速、准确地构建并更新对周围世界的三维认知模型。传统基于点云或体素的方法在精度或效率上往往难以兼顾。3DGS技术凭借其高保真、轻量级和快速渲染的特性,为构建作为智能体“眼睛”和“大脑”基础的世界模型提供了理想的技术路径。LiteGS通过攻克训练瓶颈,使得快速从机器人第一视角视频流中重建出可用于路径规划、物体操纵和场景理解的高质量三维环境成为可能,从而加速了具身智能从实验室走向实际应用的进程。

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

摩尔线程此次将LiteGS在GitHub平台全面开源,其意义远超一次竞赛的胜利或单个项目的发布。这首先体现了其“以全栈能力赋能产业”的技术战略。从自研GPU硬件到深度优化的系统软件,再到顶层的核心算法库,摩尔线程正在构建一个从硅到软件、再到应用场景的完整计算生态。其次,这为全球3DGS研究社区与产业界提供了一个高性能的基准实现与开发平台,有望吸引更多开发者共同推动神经渲染技术的演进。最后,这也向国际市场展示了中国科技公司在底层基础软件与前沿交叉学科(图形学x人工智能)上日益增强的创新实力与工程化能力。

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

展望未来,随着3DGS及其优化技术如LiteGS的成熟,我们有望看到其在更多领域开花结果:从电影游戏的高效内容制作,到工业设计的实时数字样机评审;从元宇宙中栩栩如生的虚拟场景构建,到智慧城市高精度数字孪生的动态更新。而作为底层使能技术,高效的三维感知与建模能力,无疑是人工智能迈向“理解并操作真实物理世界”这一终极目标的关键阶梯。摩尔线程LiteGS的开源,正是为攀登这一阶梯递上了一把经过精心锻造的“神兵利器”。

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/9308

(0)
上一篇 2025年12月17日 下午6:35
下一篇 2025年12月17日 下午7:01

相关推荐

  • OpenClaw创始人加盟OpenAI:从商标纠纷到AI智能体革命,一场“世代级失误”引发的行业震动

    全网称之为一次“世代级失误”。 Sam Altman and Peter Steinberger 打造了现象级智能体“OpenClaw”的 Peter Steinberger,现已正式加入 OpenAI。 这款工具最初是为了展示 Anthropic 的 Claude 模型的能力而诞生的。可以说,这是 Anthropic 多年来最好的“免费营销”——短短几天内…

    2026年2月24日
    55000
  • AI前沿速递:长视频生成突破、视觉文本压缩创新与轻量MoE模型发布

    10月26日 【开源】美团LongCat-Video视频生成模型美团LongCat团队发布基于Diffusion Transformer架构的LongCat-Video模型。该模型创新性地通过“条件帧数量”实现任务区分,原生支持文生视频、图生视频、视频续写三大核心任务,能够实现分钟级长视频的连贯生成,从根源上保障了跨帧时序一致性与物理运动的合理性。 模型链接…

    2025年11月3日
    36300
  • 国产GPU生死线:从财报看技术内卷下的商业闭环真相

    关键词:国产GPU、CUDA兼容、财务风险、生态依附、内卷竞争 对于深耕于深度学习框架底层、CUDA算子优化与芯片微架构设计一线的开发者而言,评估一家国产GPU公司,往往习惯于紧盯其宣称的算力峰值、显存带宽或对Triton/vLLM等新兴框架的支持度。 然而,商业世界的运行逻辑并非如此。在“百模大战”与Scaling Law主导的算力狂飙时代,纯粹的技术指标…

    2026年4月7日
    64000
  • Vidu Agent深度评测:AI视频创作从“片段生成”到“专业拍片”的范式革命

    2025年,视频生成AI领域正经历着前所未有的技术竞赛。谷歌Veo 3、OpenAI Sora 2、Runway Gen-4.5以及本土的Vidu等模型相继推出,参数规模不断刷新纪录,演示视频一个比一个惊艳。然而,在这场看似繁荣的技术狂欢背后,一个根本性问题逐渐浮出水面:AI能够生成高质量的视频片段,但真正“会拍片”的模型仍然凤毛麟角。创意如何系统化拆解?镜…

    2025年12月17日
    33000
  • 从竞争到共创:腾讯广告算法大赛如何催化生成式推荐的技术革命与人才迭代

    在数字广告领域,推荐系统的每一次范式迁移都深刻影响着用户体验与商业效率。近期,一场由腾讯广告主办的算法大赛,不仅以360万元的高额奖金吸引了超过8000名参赛者,更在技术社区引发了罕见的集体学习热潮。这场比赛的核心赛题——全模态生成式推荐,正悄然推动着广告推荐从传统的判别式匹配向生成式理解的深刻转型。 传统推荐系统长期依赖判别式方法,其逻辑本质是基于历史行为…

    2025年12月3日
    58300

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注