几何感知

  • DualCamCtrl:双分支扩散模型革新视频生成,几何感知让相机运动误差降低40%

    本研究的共同第一作者是来自香港科技大学(广州)EnVision Research 的张鸿飞(研究助理)和陈康豪(博士研究生),两位研究者均师从陈颖聪教授。 你的生成模型真的「懂几何」吗? 当前众多视频生成模型虽宣称具备「相机运动控制」能力,但其控制信号通常仅依赖于相机位姿。近期工作虽通过逐像素射线方向(Ray Condition)编码了运动信息,但由于模型仍…

    2025年12月21日
    7800
  • DualCamCtrl:几何感知扩散模型革新视频生成,相机运动误差降低40%

    本研究的共同第一作者是来自香港科技大学(广州)EnVision Research 的张鸿飞(研究助理)和陈康豪(博士研究生),两位研究者均师从陈颖聪教授。 你的生成模型真的「懂几何」吗?还是只是在假装对齐相机轨迹? 当前众多视频生成模型虽宣称具备「相机运动控制」能力,但其控制信号通常仅依赖于相机位姿。虽近期工作通过逐像素射线方向(Ray Condition)…

    2025年12月21日
    9600
  • Fast3Dcache:突破3D生成瓶颈,无需训练的几何感知加速框架

    在AIGC技术迅猛发展的浪潮中,3D内容生成正成为人工智能领域的重要前沿。以TRELLIS为代表的3D生成模型,通过扩散过程逐步构建三维几何结构,其生成质量已取得显著进步。然而,这类模型普遍面临一个核心挑战:生成过程缓慢且计算密集。复杂的去噪迭代与庞大的体素计算,使得生成一个高质量3D资产往往耗时数十分钟甚至数小时,严重制约了其在实时应用、游戏开发、影视制作…

    2025年12月4日
    9700