3D生成 - 鲸林向海

开源项目

中国团队突破空间智能核心技术：InSpatio-WorldFM开源实时3D世界模型，开启AI物理交互新纪元

AI领域最前沿的方向“世界模型”，正在经历一场深刻变革。互联网上，虚拟智能体在数字世界中灵活穿梭；现实中，具身机器人却仍受困于试验场，难以应对复杂的物理空间。这道横跨虚拟与现实的鸿沟，其核心在于智能体对空间智能感知的缺失。 2024年，空间智能这一关键赛道被正式点燃，成为全球科技竞争的焦点。其中，构建一个拥有永久一致性的3D场景，让智能体不仅能“看见”空间…

2026年3月6日

409000

大模型推理

首次证实RL能让3D模型学会推理，复杂文本描述下生成质量跃升！

首个系统性研究：强化学习如何让3D模型学会推理？图像生成领域，强化学习（RL）已交出亮眼答卷。那么，在更具挑战性的3D生成领域，RL能否同样奏效？当GRPO等算法让大模型在数学、代码推理上实现质变时，一项开创性研究率先给出了答案——首个将强化学习系统性引入文本到3D自回归生成的工作正式诞生，并已被CVPR 2026接收。该研究并非简单移植2D经验，而是针…

2026年2月27日

131000

大模型推理

RL赋能3D生成新突破：首个系统性强化学习研究让3D模型学会复杂文本推理，生成质量大幅跃升

RL赋能3D生成新突破：首个系统性强化学习研究让3D模型学会复杂文本推理图像生成领域，强化学习（RL）已取得显著成果。那么，3D生成呢？当GRPO（Group Relative Policy Optimization）等技术推动大模型在数学、代码推理上实现质变时，一项开创性研究率先给出了答案——首个将强化学习系统性引入文本到3D自回归生成的研究正式诞生，…

2026年2月27日

87000

AI产业动态

腾讯混元开源HY3D-Bench：构建3D生成领域的“ImageNet”，破解数据与评估瓶颈

3D生成技术如今在可用性上已达到令人惊艳的程度。然而，数据质量参差不齐、评估标准缺失以及长尾类别覆盖不足这三大痛点，依然困扰着该领域的研究者。针对这些问题，腾讯混元3D团队在最新技术报告《HY3D-Bench: Generation of 3D Assets》中，正式开源了一套革命性的3D内容生成生态系统。该工作通过自动化数据清洗流水线，从Objave…

2026年2月6日

97000

AI产业动态

Fast3Dcache：突破3D生成瓶颈，无需训练的几何感知加速框架

在AIGC技术迅猛发展的浪潮中，3D内容生成正成为人工智能领域的重要前沿。以TRELLIS为代表的3D生成模型，通过扩散过程逐步构建三维几何结构，其生成质量已取得显著进步。然而，这类模型普遍面临一个核心挑战：生成过程缓慢且计算密集。复杂的去噪迭代与庞大的体素计算，使得生成一个高质量3D资产往往耗时数十分钟甚至数小时，严重制约了其在实时应用、游戏开发、影视制作…

2025年12月4日

192000

AI产业动态

PartCrafter：结构化3D生成革命，从单图到可编辑部件级网格的端到端突破

在计算机图形学与人工智能生成内容（AIGC）的交叉领域，从单张二维图像直接生成高质量三维模型一直是学术界和工业界共同追求的目标。然而，传统3D生成模型普遍存在一个根本性局限：它们将三维物体视为不可分割的“黑箱”整体进行处理，生成的模型虽然外观逼真，但内部结构完全融合，用户无法对个别部件（如椅子的腿、汽车的轮子、桌子的抽屉）进行独立编辑、移动、旋转或替换。这种…

2025年11月27日

207000

AI产业动态

PhysX-Anything：单图生成仿真就绪3D资产，突破具身智能物理建模瓶颈

在机器人、具身智能和交互仿真等前沿领域，对高质量、可直接用于物理仿真的3D资产需求日益迫切。传统3D生成方法多聚焦于几何外观与视觉保真度，却普遍忽视密度、绝对尺度、关节约束等关键物理属性，导致生成模型难以直接应用于真实世界的控制与交互任务。尽管已有少数研究探索可动3D对象生成，但受限于高质量物理标注数据的稀缺，现有方法多采用“检索现有模型+附加运动”的范式，…

2025年11月23日

167000

AI产业动态

Meta WorldGen：文本驱动3D世界生成的革命性突破与产业影响分析

在生成式AI技术快速演进的浪潮中，Meta最新发布的WorldGen研究标志着3D内容创作领域迈入了全新的范式。这项技术不仅实现了从简单文本提示到完整可交互3D世界的端到端生成，更在几何一致性、空间连贯性和功能实用性方面取得了突破性进展，为游戏开发、虚拟仿真、沉浸式社交等应用场景带来了革命性的可能性。从技术架构层面分析，WorldGen采用了多阶段融合的创…

2025年11月22日

183000

AI产业动态

AI大模型技术周报：阿里Qwen3-VL、DeepSeek-OCR、讯飞Spark-Scilit-X1、腾讯混元世界模型重磅更新

10月21日【闭源】阿里发布Qwen3-VL-32B系列模型阿里发布了Qwen3-VL-32B-Thinking和Qwen3-VL-32B-Instruct两款32B参数的Dense模型。该系列在文档识别与理解、空间感知与万物识别、视觉2D检测与空间推理等能力上表现优异，适用于通用场景下的复杂感知任务。详情链接：https://help.aliyun.c…

2025年10月27日

214000