摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

2025年12月,在香港举办的SIGGRAPH Asia 2025大会上,一场聚焦3D Gaussian Splatting(3DGS)重建技术的国际挑战赛结果揭晓。中国芯片与计算公司摩尔线程凭借其自研的3DGS基础库LiteGS,在3DGS重建挑战赛中脱颖而出,荣获银奖。这一成绩不仅是对其算法与工程能力的认可,更标志着国产计算技术在神经渲染这一前沿领域已具备国际竞争力。

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

3DGS,即三维高斯溅射,自2023年提出以来,已成为计算机图形学与视觉领域的一场范式革命。它通过使用数百万个可参数化的三维高斯椭球(称为“高斯基元”)来表示场景,实现了渲染质量、速度与资源消耗之间的卓越平衡。与传统神经辐射场(NeRF)技术相比,3DGS能在保持甚至提升视觉保真度的同时,将新视角的渲染速度提升数百至上千倍,达到实时交互的水平。这种突破性进展,使其迅速在虚拟现实(VR)、增强现实(AR)、数字孪生、自动驾驶仿真等需要高质量实时三维可视化的领域获得广泛应用前景。

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

然而,3DGS技术从“可用”到“好用”,仍面临一个核心瓶颈:尽管其渲染(推理)速度极快,但模型的训练(优化)过程却异常耗时。一个高质量3DGS模型的训练通常需要数十分钟甚至数小时,这严重制约了其在需要快速迭代或实时重建场景(如机器人交互、即时AR内容创建)中的实用化进程。现有优化方案多从算法或硬件单一方面入手,缺乏系统性的全栈协同设计,难以从根本上突破性能天花板。

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

正是在此背景下,摩尔线程LiteGS的价值得以凸显。本次SIGGRAPH Asia的3DGS重建挑战赛设置了严苛的实用化导向任务:参赛者需在60秒内,仅凭一段10-30秒的真实终端视频、存在误差的相机轨迹以及终端SLAM(同步定位与地图构建)点云,完成高质量的3DGS重建。竞赛以峰值信噪比(PSNR,衡量重建质量)和重建总耗时作为核心评价指标。摩尔线程AI团队(参赛编号MT-AI)交出的答卷令人瞩目:在平均PSNR达到27.58(位列前三)的高质量前提下,其重建总耗时仅需34秒,显著领先于多数参赛队伍,最终斩获银奖。这一成绩直观证明了LiteGS在精度与效率之间取得的极致平衡。

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

摩尔线程实现这一突破的关键,在于其首次实现了从底层GPU系统、中层数据管理到高层算法设计的全链路协同优化,而非局部修补。具体而言,LiteGS的创新体系体现在三个层面:

在**GPU系统与计算范式**层面,LiteGS创新性地提出了基于“One Warp Per Tile”原则的“Warp-Based Raster”光栅化新范式。它将传统复杂的梯度聚合计算简化为一次Warp(GPU线程束)内的归约操作,并结合扫描线算法与混合精度策略,大幅降低了梯度计算的开销,同时实现了高效的像素级统计,为上层算法提供了强有力的底层支撑。

在**数据管理与调度**层面,面对3DGS中数以百万计、空间分布稀疏的高斯基元,LiteGS引入了一套“聚类-剔除-压缩”的智能流水线。它利用Morton编码对高斯基元进行动态的空间重排,以极低开销显著提升了数据访问的局部性,从而有效减少了GPU缓存失效和Warp执行路径的分化,确保了计算单元的高效利用。

在**核心算法设计**层面,LiteGS摒弃了原有方案中较为模糊的致密化(Densification)度量指标,转而采用更为鲁棒的像素不透明度梯度方差作为核心判据。这一改进能够更精准地识别场景中的欠拟合区域,指导高斯基元的自适应增删,其轻量化的计算过程直接受益于底层新型光栅化器提供的高效统计能力,形成了算法与系统间的正向循环。

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

这种全栈协同优化的威力,通过详实的性能数据得以验证。在达到与当前质量最优开源方案同等PSNR水平时,LiteGS能实现高达10.8倍的训练加速,同时模型参数量减少一半以上,显著降低了存储与传输开销。在控制参数量相同的情况下,LiteGS的PSNR指标能超出主流方案0.2-0.4 dB,而训练时间则缩短了3.8至7倍。尤为突出的是,在面向轻量化、高效率的应用场景时,LiteGS仅需原版3DGS约10%的训练时间与20%的参数量,即可实现同等的渲染质量。这为其在资源受限的边缘设备或对延迟极度敏感的应用中部署扫清了障碍。

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

LiteGS的技术突破,对于正处爆发前夜的**具身智能(Embodied AI)** 领域具有深远意义。具身智能要求智能体(如机器人)能够理解并与复杂的物理环境进行实时、安全的交互。其核心挑战之一在于如何快速、准确地构建并更新对周围世界的三维认知模型。传统基于点云或体素的方法在精度或效率上往往难以兼顾。3DGS技术凭借其高保真、轻量级和快速渲染的特性,为构建作为智能体“眼睛”和“大脑”基础的世界模型提供了理想的技术路径。LiteGS通过攻克训练瓶颈,使得快速从机器人第一视角视频流中重建出可用于路径规划、物体操纵和场景理解的高质量三维环境成为可能,从而加速了具身智能从实验室走向实际应用的进程。

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

摩尔线程此次将LiteGS在GitHub平台全面开源,其意义远超一次竞赛的胜利或单个项目的发布。这首先体现了其“以全栈能力赋能产业”的技术战略。从自研GPU硬件到深度优化的系统软件,再到顶层的核心算法库,摩尔线程正在构建一个从硅到软件、再到应用场景的完整计算生态。其次,这为全球3DGS研究社区与产业界提供了一个高性能的基准实现与开发平台,有望吸引更多开发者共同推动神经渲染技术的演进。最后,这也向国际市场展示了中国科技公司在底层基础软件与前沿交叉学科(图形学x人工智能)上日益增强的创新实力与工程化能力。

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

展望未来,随着3DGS及其优化技术如LiteGS的成熟,我们有望看到其在更多领域开花结果:从电影游戏的高效内容制作,到工业设计的实时数字样机评审;从元宇宙中栩栩如生的虚拟场景构建,到智慧城市高精度数字孪生的动态更新。而作为底层使能技术,高效的三维感知与建模能力,无疑是人工智能迈向“理解并操作真实物理世界”这一终极目标的关键阶梯。摩尔线程LiteGS的开源,正是为攀登这一阶梯递上了一把经过精心锻造的“神兵利器”。

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎

摩尔线程LiteGS开源:以全栈协同优化攻克3DGS训练瓶颈,为具身智能提供高效三维建模引擎


关注“鲸栖”小程序,掌握最新AI资讯

本文由鲸栖原创发布,未经许可,请勿转载。转载请注明出处:http://www.itsolotime.com/archives/9308

(0)
上一篇 2天前
下一篇 1天前

相关推荐

  • 昇腾CANN全面开源:重塑AI算力生态,赋予开发者底层定义权

    在人工智能技术飞速发展的当下,大模型竞争已进入白热化阶段,而算力基础设施的自主可控与开放创新成为行业关注的焦点。近日,华为昇腾宣布将其核心底层基础软件——CANN(Compute Architecture for Neural Networks,神经网络异构计算架构)全面开源开放,这一举措不仅标志着国产AI算力生态建设迈出关键一步,更可能从根本上改变全球计算…

    13小时前
    400
  • 内容主权与AI爬取博弈:Cloudflare内容信号政策如何重塑互联网契约

    在AI技术浪潮席卷全球的当下,互联网内容生态正面临前所未有的结构性挑战。传统模式下,网站运营者陷入两难困境:完全开放内容意味着数据被无偿爬取、流量被平台虹吸;而设置登录墙或严格屏蔽爬虫则会导致用户触达率骤降,商业价值受损。这种矛盾在生成式AI和大模型训练需求爆炸性增长的背景下被急剧放大——AI公司需要海量高质量数据训练模型,而内容创作者却难以从数据价值中分得…

    2025年10月19日
    300
  • 3DGS压缩新范式:基于高斯混合简化的几何结构保持方法

    在三维视觉领域,3D Gaussian Splatting(3DGS)作为近年来兴起的高效三维场景建模技术,通过大量各向异性高斯球的分布与渲染,实现了高质量的新视角合成。然而,其核心挑战在于高斯球的高度冗余性,这直接制约了模型的存储效率与渲染速度。传统压缩方法多采用基于重要性得分的剪枝策略,虽能减少高斯数量,但往往以破坏全局几何结构为代价,导致细节丢失或场景…

    2025年11月14日
    700
  • 2025人工智能年度榜单深度解析:评选标准、产业趋势与未来展望

    随着人工智能技术从实验室走向规模化应用,行业正经历着前所未有的变革。量子位主办的「2025人工智能年度榜单」评选已进入第八个年头,这不仅是一个简单的评选活动,更是中国AI产业发展的重要风向标。本文将从评选维度、产业趋势和技术演进三个层面,深入分析这一年度盛事背后的深层意义。 从评选维度来看,本次榜单设置了企业、产品、人物三大类别,每个类别下又细分为多个奖项,…

    2025年11月16日
    500
  • Gemini 3 Pro引爆创意革命:从文本到交互式应用的AI生成新范式

    在人工智能技术快速迭代的浪潮中,谷歌最新发布的Gemini 3 Pro模型以其惊人的多模态生成能力,正在重新定义创意实现的边界。这款被网友戏称为“与上一代2.5 Pro之间差出一个GPT-5.1”的模型,仅发布一天就催生了大量令人惊叹的应用实例,展现出从简单文本描述到完整交互式应用的跨越式生成能力。 从技术架构层面分析,Gemini 3 Pro的核心突破在于…

    2025年11月20日
    400

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注