潜空间推理

大模型推理

清华&港中文团队提出ColaVLA：自动驾驶推理告别文本，潜空间思维+分层并行规划引领新范式

过去两年，自动驾驶与大模型（尤其是视觉语言模型，VLM）的结合成为热门研究方向。一个直观的思路是：利用VLM强大的场景理解与推理能力，使其像人类驾驶员一样，先理解环境、再做判断、最后输出控制轨迹。然而，将这一思路落地到自动驾驶领域时，一个普遍存在的问题是：许多方法虽然引入了大模型，却仍将“推理”过程构建为文本链式思维（Chain-of-Thought）。即…

6小时前
33000