摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

2025年12月,在香港举办的SIGGRAPH Asia 2025大会上,一场聚焦3D Gaussian Splatting(3DGS)重建技术的国际挑战赛结果揭晓。中国芯片与计算公司摩尔线程凭借其自研的3DGS基础库LiteGS,在3DGS重建挑战赛中脱颖而出,荣获银奖。这一成绩不仅是对其算法与工程能力的认可,更标志着国产计算技术在神经渲染这一前沿领域已具备国际竞争力。

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

3DGS,即三维高斯溅射,自2023年提出以来,已成为计算机图形学与视觉领域的一场范式革命。它通过使用数百万个可参数化的三维高斯椭球(称为“高斯基元”)来表示场景,实现了渲染质量、速度与资源消耗之间的卓越平衡。与传统神经辐射场(NeRF)技术相比,3DGS能在保持甚至提升视觉保真度的同时,将新视角的渲染速度提升数百至上千倍,达到实时交互的水平。这种突破性进展,使其迅速在虚拟现实(VR)、增强现实(AR)、数字孪生、自动驾驶仿真等需要高质量实时三维可视化的领域获得广泛应用前景。

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

然而,3DGS技术从“可用”到“好用”,仍面临一个核心瓶颈:尽管其渲染(推理)速度极快,但模型的训练(优化)过程却异常耗时。一个高质量3DGS模型的训练通常需要数十分钟甚至数小时,这严重制约了其在需要快速迭代或实时重建场景(如机器人交互、即时AR内容创建)中的实用化进程。现有优化方案多从算法或硬件单一方面入手,缺乏系统性的全栈协同设计,难以从根本上突破性能天花板。

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

正是在此背景下,摩尔线程LiteGS的价值得以凸显。本次SIGGRAPH Asia的3DGS重建挑战赛设置了严苛的实用化导向任务:参赛者需在60秒内,仅凭一段10-30秒的真实终端视频、存在误差的相机轨迹以及终端SLAM(同步定位与地图构建)点云,完成高质量的3DGS重建。竞赛以峰值信噪比(PSNR,衡量重建质量)和重建总耗时作为核心评价指标。摩尔线程AI团队(参赛编号MT-AI)交出的答卷令人瞩目:在平均PSNR达到27.58(位列前三)的高质量前提下,其重建总耗时仅需34秒,显著领先于多数参赛队伍,最终斩获银奖。这一成绩直观证明了LiteGS在精度与效率之间取得的极致平衡。

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

摩尔线程实现这一突破的关键,在于其首次实现了从底层GPU系统、中层数据管理到高层算法设计的全链路协同优化,而非局部修补。具体而言,LiteGS的创新体系体现在三个层面:

在**GPU系统与计算范式**层面,LiteGS创新性地提出了基于“One Warp Per Tile”原则的“Warp-Based Raster”光栅化新范式。它将传统复杂的梯度聚合计算简化为一次Warp(GPU线程束)内的归约操作,并结合扫描线算法与混合精度策略,大幅降低了梯度计算的开销,同时实现了高效的像素级统计,为上层算法提供了强有力的底层支撑。

在**数据管理与调度**层面,面对3DGS中数以百万计、空间分布稀疏的高斯基元,LiteGS引入了一套“聚类-剔除-压缩”的智能流水线。它利用Morton编码对高斯基元进行动态的空间重排,以极低开销显著提升了数据访问的局部性,从而有效减少了GPU缓存失效和Warp执行路径的分化,确保了计算单元的高效利用。

在**核心算法设计**层面,LiteGS摒弃了原有方案中较为模糊的致密化(Densification)度量指标,转而采用更为鲁棒的像素不透明度梯度方差作为核心判据。这一改进能够更精准地识别场景中的欠拟合区域,指导高斯基元的自适应增删,其轻量化的计算过程直接受益于底层新型光栅化器提供的高效统计能力,形成了算法与系统间的正向循环。

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

这种全栈协同优化的威力,通过详实的性能数据得以验证。在达到与当前质量最优开源方案同等PSNR水平时,LiteGS能实现高达10.8倍的训练加速,同时模型参数量减少一半以上,显著降低了存储与传输开销。在控制参数量相同的情况下,LiteGS的PSNR指标能超出主流方案0.2-0.4 dB,而训练时间则缩短了3.8至7倍。尤为突出的是,在面向轻量化、高效率的应用场景时,LiteGS仅需原版3DGS约10%的训练时间与20%的参数量,即可实现同等的渲染质量。这为其在资源受限的边缘设备或对延迟极度敏感的应用中部署扫清了障碍。

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

LiteGS的技术突破,对于正处爆发前夜的**具身智能(Embodied AI)** 领域具有深远意义。具身智能要求智能体(如机器人)能够理解并与复杂的物理环境进行实时、安全的交互。其核心挑战之一在于如何快速、准确地构建并更新对周围世界的三维认知模型。传统基于点云或体素的方法在精度或效率上往往难以兼顾。3DGS技术凭借其高保真、轻量级和快速渲染的特性,为构建作为智能体“眼睛”和“大脑”基础的世界模型提供了理想的技术路径。LiteGS通过攻克训练瓶颈,使得快速从机器人第一视角视频流中重建出可用于路径规划、物体操纵和场景理解的高质量三维环境成为可能,从而加速了具身智能从实验室走向实际应用的进程。

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

摩尔线程此次将LiteGS在GitHub平台全面开源,其意义远超一次竞赛的胜利或单个项目的发布。这首先体现了其“以全栈能力赋能产业”的技术战略。从自研GPU硬件到深度优化的系统软件,再到顶层的核心算法库,摩尔线程正在构建一个从硅到软件、再到应用场景的完整计算生态。其次,这为全球3DGS研究社区与产业界提供了一个高性能的基准实现与开发平台,有望吸引更多开发者共同推动神经渲染技术的演进。最后,这也向国际市场展示了中国科技公司在底层基础软件与前沿交叉学科(图形学x人工智能)上日益增强的创新实力与工程化能力。

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

展望未来,随着3DGS及其优化技术如LiteGS的成熟,我们有望看到其在更多领域开花结果:从电影游戏的高效内容制作,到工业设计的实时数字样机评审;从元宇宙中栩栩如生的虚拟场景构建,到智慧城市高精度数字孪生的动态更新。而作为底层使能技术,高效的三维感知与建模能力,无疑是人工智能迈向“理解并操作真实物理世界”这一终极目标的关键阶梯。摩尔线程LiteGS的开源,正是为攀登这一阶梯递上了一把经过精心锻造的“神兵利器”。

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/9308

(0)
上一篇 2025年12月17日 下午6:35
下一篇 2025年12月17日 下午7:01

相关推荐

  • 跨学科突破:神经科学与AI融合,打造类人记忆Agent系统

    跨学科突破:神经科学如何让 Agent 拥有「人类式」记忆? 你是否设想过,AI Agent 能像人类一样,通过积累经验实现自我成长?如今,这一愿景正加速走向现实。然而,当前的研究要么局限于AI技术本身,要么对人脑记忆机制的借鉴流于表面,两个学科之间始终缺乏深刻的交叉与碰撞。 近期,来自哈尔滨工业大学、鹏城实验室、新加坡国立大学、复旦大学和北京大学的研究团队…

    2026年1月10日
    16400
  • 揭秘宇树人形机器人5500台全球销量背后的真实买家画像与产业拐点

    近日,2026年春晚再次引入宇树科技作为机器人合作伙伴。在2025年春晚上,其人形机器人曾成为全民话题,在高密度灯光与音乐节奏中自主完成整齐划一的行走、转身与协同动作。而对于产业来说,真正值得被记住的,并不只是舞台上的几分钟。 就在几天前,宇树科技对外披露了一组此前从未公开过的数据:2025年,宇树全年机器人实际出货量超过5500台,且全部为真实销售并完成交…

    2026年1月29日
    16500
  • 视觉压缩革命:DeepSeek-OCR与VTCBench如何重塑长文本理解的未来?

    DeepSeek-OCR 提出的视觉文本压缩(Vision-Text Compression, VTC)技术,通过将文本编码为视觉 Token,实现了高达 10 倍的压缩率,显著降低了大模型处理长文本的计算与显存成本。然而,一个核心问题随之浮现:视觉语言模型(VLM)能否真正理解这种高度压缩后的高密度信息? 为了系统性地评估模型在视觉压缩范式下的认知能力,来…

    2026年1月10日
    13300
  • MiniCPM-o 4.5:9B参数开源全模态模型,端侧设备上的GPT-4o平替

    MiniCPM-o 4.5:9B参数开源全模态模型,端侧设备上的GPT-4o平替 MiniCPM-o 4.5 是由面壁智能 OpenBMB 开源的新一代全模态旗舰模型,其参数量仅为 9B。该模型在多项任务上对标甚至超越了部分闭源大模型,被广泛视为端侧设备上的 GPT‑4o 平替。目前,MiniCPM-o 4.5 已登上 Hugging Face 热榜第二位。…

    2026年2月13日
    10200
  • 春晚舞台上演机器人功夫秀:宇树科技全自主集群控制技术全球首秀

    这已经是宇树机器人第三次亮相春晚,却带来了前所未有的震撼。 在今年的央视春节联欢晚会上,全球领先的宇树科技将舞台变成了新技术的展示场。一群活力十足的人形机器人上演了一出武术表演《武 BOT》,全程镜头连贯,几乎没有切换。 表演中的人形机器人型号包括现象级的 G1 以及刚刚发布的 H2。它们在快速奔跑中完成了穿插变阵和复杂的武术动作。这种高动态、高协同的全自主…

    2026年2月19日
    6300

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注