自动驾驶
-
11.77亿资本押注卡车新势力「一哥」,L2升维路线率先在商用车跑通!
贾浩楠 发自 凹非寺 量子位 | 公众号 QbitAI 在技术门槛高、商业化挑战大的硬核赛道,总有玩家能够逆周期成长—— 2026年初,自动驾驶赛道迎来首笔重磅投资:卡车新势力DeepWay深向宣布完成总额11.77亿元的Pre-IPO轮融资。 DeepWay深向成立仅5年,却持续获得VC与产业资本青睐,Pre-IPO轮次历经多轮扩充,现已进入冲刺港交所的阶…
-
OVSeg3R:革新3D实例分割,基于2D先验实现开集识别与低成本标注
3D模型的实例分割一直受限于稀缺的训练数据与高昂的标注成本,训练效果有待提升。 近年来,利用成熟海量的2D实例分割数据来辅助实现3D实例分割成为一个极具潜力的研究方向,但实现思路不尽相同。 近日,IDEA计算机视觉与机器人研究中心(CVR,Computer Vision and Robotics)的张磊团队提出了一种名为OVSeg3R的开集3D实例分割学习新…
-
英伟达CES 2026技术盛宴:Rubin架构、开源AI与物理智能革命
2026,黄仁勋开年第一讲来了! 5个小时前,英伟达创始人黄仁勋现身拉斯维加斯的CES 2026现场。3000名观众坐满礼堂,庭院里还有2000人在观看;全球数百万人通过直播欣赏这场新年技术盛宴。 这是我们今年的第一场主题演讲,我们得先把“蜘蛛网”清理掉。 黄仁勋的演讲长达90分钟,用他自己的话说,今天要“塞进去”的内容大概有15公斤那么多。 他首先开门见山…
-
英伟达CES 2026重磅发布:Rubin架构GPU性能飙升5倍,物理AI平台Cosmos引领全栈生态革命
英伟达CES 2026重磅发布:Rubin架构GPU性能飙升5倍,物理AI平台Cosmos引领全栈生态革命 刚刚,英伟达CEO黄仁勋在全球最大消费电子展CES 2026上发布了全新AI产品。这是五年来英伟达首次在CES上未发布游戏显卡,其战略重心已明确转向全力投入AI。 这一战略的成果引人瞩目。下一代Rubin架构GPU在NVFP4数据格式下,推理与训练性能…
-
FastDriveVLA:专为自动驾驶VLA模型定制的视觉token剪枝方法,实现高效端到端驾驶
VLA 模型正被越来越多地应用于端到端自动驾驶系统中。然而,VLA 模型中冗长的视觉 token 极大地增加了计算成本。现有的通用视觉 token 剪枝方法并非为自动驾驶场景设计,在实际应用中存在诸多局限性。 小鹏汽车联合北京大学计算机科学学院多媒体信息处理国家重点实验室发表论文《FastDriveVLA》,为自动驾驶 VLA 模型中的高效视觉 token …
-
特斯拉FSD V14.2创历史:Model 3横穿美国1万英里零干预,马斯克预言终成真
在 2025 年的最后一天,一位名叫 David Moss 的特斯拉车主完成了一项创纪录的壮举:他驾驶一辆搭载 FSD V14.2 系统的 2025 款 Model 3,从美国西海岸的洛杉矶出发,全程零人工干预,成功抵达东海岸的南卡罗来纳州,实现了世界上首次横跨美国大陆的全自动驾驶旅程。 这次旅程始于洛杉矶的 Tesla Diner,终点是南卡罗来纳州的 M…
-
特斯拉Robovan:20座无方向盘自动驾驶概念车,每公里成本仅3毛钱
前段时间,旧金山大停电,Waymo 无人驾驶出租车集体趴窝,但依靠 FSD 系统驱动的特斯拉汽车丝毫不受影响。 而去年在「we,robot」活动首次亮相的特斯拉 Robovan 视频,也被网友翻了出来。 马斯克反手就是一个转发,并配文称「这将彻底改变街道的面貌」。 评论区也炸了锅。网友纷纷表示很有未来感,「我们终于可以过上像杰森一家那样的生活了」。 甚至有网…
-
特斯拉FSD v14通过物理图灵测试:英伟达机器人主管亲测认证,自动驾驶迎来新里程碑
特斯拉FSD v14,首个通过「物理图灵测试」的AI。 为特斯拉「颁发」这一殊荣的并非别人,而是英伟达大名鼎鼎的机器人主管——Jim Fan。 平安夜前夕,这位英伟达Project GR00T的领军人物,在亲眼看到自家特斯拉的一路自主护送自己回家后,大受震撼: 我入手特斯拉比较晚,但却是最早体验FSD v14的用户之一。这可能是我第一次真正感受到通过物理图灵…
-
MiMo-Embodied:全球首个跨具身基座模型的技术突破与产业影响
在人工智能技术快速演进的当下,具身智能与自动驾驶作为两大前沿领域,长期面临着知识迁移与能力统一的挑战。传统视觉语言模型(VLMs)往往局限于单一场景——要么专注于室内机器人操作,要么聚焦于户外驾驶任务,这种割裂状态严重制约了智能体在动态物理世界中的综合交互能力。近日,小米汽车陈龙团队开源了全球首个打通自动驾驶与具身操作场景的跨具身(X-Embodied)基座…
-
世界模型破解VLA监督稀疏难题:DriveVLA-W0如何放大自动驾驶数据规模定律
在自动驾驶技术从实验室走向商业化的关键阶段,视觉-语言-动作(VLA)大模型正面临着一个根本性的发展瓶颈:监督稀疏问题。特斯拉在ICCV会议上公开指出,当前VLA模型虽然能够处理高维、稠密的视觉信息流,但其训练监督信号却仅限于低维、稀疏的驾驶动作(如转向角度、加速度等路径点指令)。这种输入与监督之间的维度不匹配,导致模型无法充分利用PB级海量数据的潜力,严重…