CVPR2026
-
超声AI新突破!浙大联合团队发布首个大规模超声图文数据集US-365K,打造超声专用大模型Ultrasound-CLIP
超声领域迎来专用大模型。超声影像因实时、无辐射的特性,已成为临床一线诊断的重要手段。然而,异质的解剖结构与多样的诊断属性使得通用视觉语言预训练模型难以直接适配,且现有医疗跨模态数据中超声样本占比不足5%,成为该领域研究的关键瓶颈。 △ 超声图像在主要跨模态基准数据集中的占比分布。 图中红色区域及内部百分比代表超声图像的占比,蓝色区域为其他模态占比。顶部标签为…
-
清华&港中文团队提出ColaVLA:自动驾驶推理告别文本,潜空间思维+分层并行规划引领新范式
过去两年,自动驾驶与大模型(尤其是视觉语言模型,VLM)的结合成为热门研究方向。一个直观的思路是:利用VLM强大的场景理解与推理能力,使其像人类驾驶员一样,先理解环境、再做判断、最后输出控制轨迹。 然而,将这一思路落地到自动驾驶领域时,一个普遍存在的问题是:许多方法虽然引入了大模型,却仍将“推理”过程构建为文本链式思维(Chain-of-Thought)。即…
-
CVPR2026满分论文:Proxy-GS实现3D高斯溅射2.5倍渲染加速,用轻量代理网格统一遮挡先验
在城市街景场景中,Proxy-GS 在保持细粒度视觉细节的同时,实现了稳定的实时渲染。该方法显著减少了需要解码的锚点数量,从而在内存效率和渲染速度两方面都带来了显著提升。右上角的插图展示了所有锚点的俯视可视化,其中以红色高亮的锚点表示当前帧中被解码器使用的锚点。 Proxy-GS:面向结构化3D高斯溅射的统一遮挡先验 论文链接:https://arxiv.o…
