具身智能领军学者苏昊加盟复旦,领衔建设通用物理智能研究院

具身智能领军学者苏昊加盟复旦,领衔建设通用物理智能研究院

具身智能领域论文被引次数最高的华人学者,带着十七年的海外科研积淀,正式回国。

在第五届中国三维视觉大会(China3DV 2026)上,李飞飞弟子、ImageNet缔造者之一苏昊复旦大学正式宣布引进。加盟后,他将担任复旦大学浩清特聘教授,并领衔建设通用物理智能研究院,出任院长一职。

具身智能领军学者苏昊加盟复旦,领衔建设通用物理智能研究院

复旦大学将苏昊的回归,视为学校“面向智能时代的关键落子”。实际上,在官方宣布之前,加州大学圣地亚哥分校(UCSD)和复旦校园内已有传言称,这位具身智能领域的领跑者即将加盟。如今传闻落地,这场备受期待的回归已成现实。

谁是苏昊?

苏昊是具身智能领域论文被引次数最高的华人学者。他是ImageNet的缔造者之一,也是ShapeNet、PointNet、PartNet、SAPIEN、ManiSkill等一系列奠基性项目的主导者。此外,他还是具身智能公司Hillbot的联合创始人兼首席技术官。

在加盟复旦前,苏昊是加州大学圣地亚哥分校(UCSD)计算机科学与工程系的副教授,并担任其具身智能实验室主任。此前,他在UCSD的个人主页已停止更新维护。

具身智能领军学者苏昊加盟复旦,领衔建设通用物理智能研究院

目前,苏昊新的个人主页已更新其在复旦的最新任职信息。

具身智能领军学者苏昊加盟复旦,领衔建设通用物理智能研究院

截至当前,其谷歌学术论文被引次数已超过14.5万次,在具身人工智能领域的华人学者中位列第一。

具身智能领军学者苏昊加盟复旦,领衔建设通用物理智能研究院

去年,他与谢赛宁共同获得了CVPR青年学者奖,以表彰他们在计算机视觉领域的杰出贡献。

具身智能领军学者苏昊加盟复旦,领衔建设通用物理智能研究院

值得一提的是,苏昊是弋力(清华大学交叉信息研究院助理教授)、卢策吾(穹彻智能创始人、上海交通大学教授)、王鹤(银河通用创始人、北京大学助理教授)、严梦媛(OpenAI研究员)、莫凯淳(英伟达研究员)等多位知名学者的师兄。

从北航到普林斯顿,再到斯坦福

2002年,苏昊进入北京航空航天大学攻读计算机科学本科,成为北航高等理工学院的第一届学员。本科期间,他师从中科院院士、前北航校长李未教授,研究数理逻辑与定理自动证明。

2005年,经李未教授推荐,他前往微软亚洲研究院实习,师从孙剑、沈向洋、周明。初期他主攻自然语言处理,但随着研究深入,他逐渐意识到,相较于抽象的语言,直接来自物理世界的信号(如视觉)才是理解智能更根本的途径。这一认知推动他的研究重心转向计算机视觉。

2008年,在沈向洋的推荐下,苏昊先后在普林斯顿和斯坦福参与了ImageNet项目,并于2009年跟随李飞飞正式转入斯坦福大学

具身智能领军学者苏昊加盟复旦,领衔建设通用物理智能研究院

ImageNet这一奠基性数据集,后来深刻影响了近二十年的人工智能发展浪潮。

在ImageNet之后,苏昊与李佳合作了Object Bank项目,进一步提升了图像在高层视觉任务中的语义表示能力,使得简单分类器也能在物体识别和场景分类等任务上取得优异性能。该研究成果发表于2010年的NeurIPS会议。

具身智能领军学者苏昊加盟复旦,领衔建设通用物理智能研究院

3D视觉的奠基人

当2D视觉的方法论日趋成熟后,苏昊将目光投向了3D视觉。

2014年,在获得北航数学博士学位后,他在Leonidas Guibas指导下于斯坦福大学攻读计算机科学博士学位,主攻三维感知。

2015年,他发布了ShapeNet——全球首个大规模3D形状数据集,包含超过300万个3D CAD模型,涵盖3135个类别,被外界誉为“3D领域的ImageNet”。

具身智能领军学者苏昊加盟复旦,领衔建设通用物理智能研究院

ShapeNet的发布,标志着3D视觉研究进入黄金发展期。

2017年,PointNet与PointNet++相继发布,使得3D视觉相关论文在顶级会议中的占比从不足10%跃升至70%。其中,PointNet是首个直接处理原始点云数据的深度学习模型,而PointNet++则能进一步捕捉点云中的局部结构信息。这两项工作如今已广泛应用于自动驾驶系统。

具身智能领军学者苏昊加盟复旦,领衔建设通用物理智能研究院

2018年获得斯坦福大学计算机科学博士后,苏昊又发布了细粒度3D物体部件数据集PartNet,随后入职加州大学圣地亚哥分校。

从视觉到具身

解决了感知问题后,苏昊开始思考下一个挑战:能否将具体的感知算法整合进一个更大的系统?

这一思考驱使他从计算机视觉研究迁移到机器人领域。

2020年,他基于PartNet发布了全球首个以可泛化操作为核心的物理仿真平台——SAPIEN(命名灵感来自《人类简史》中的“智人”),为机器人视觉与交互任务的研究搭建了关键基础设施。

具身智能领军学者苏昊加盟复旦,领衔建设通用物理智能研究院

2021年,他又在此基础上推出了ManiSkill机器人操作技能仿真与评测平台。

具身智能领军学者苏昊加盟复旦,领衔建设通用物理智能研究院

同年的ICCV大会上,苏昊发起专题研讨会,聚焦基于物理的建模与仿真、基于学习的仿真、人体仿真到具身视觉和机器人学习等广泛主题。

具身智能领军学者苏昊加盟复旦,领衔建设通用物理智能研究院

这些科研成果也延续到了他创办的具身智能公司Hillbot中。2024年,苏昊加入创业浪潮,创办了Hillbot并担任首席技术官。

具身智能领军学者苏昊加盟复旦,领衔建设通用物理智能研究院

Hillbot的核心技术资产正是苏昊此前发布的SAPIEN仿真器及ManiSkill训练平台,主打模拟与3D生成。此外,Hillbot已与英伟达合作,借助NVIDIA Omniverse平台生成高仿真视频训练数据。

产品方面,Hillbot推出了轮式机器人Hillbot Alpha。该机器人基于仿真环境训练,主要用于零售店、咖啡馆和制造车间等复杂环境下的移动操纵任务。

具身智能领军学者苏昊加盟复旦,领衔建设通用物理智能研究院

为什么选择复旦?

对于选择加盟复旦大学,苏昊给出了简洁而坚定的解释:

因为复旦要做的事,与我要做的事,是同一件事。

这件事,便是推动“物理智能”的最终实现

物理智能,指的是让AI系统能在物理世界中有效完成任务——既能理解世界,也能执行恰当的行动。在苏昊看来,这不仅是算法问题,更涉及机器人实体、多学科交融以及一个完善的产业生态。

他看中复旦的理由具体而落地:复旦大学拥有深厚的数学、物理学科根基,正在积极推进新工科建设,并且地处上海及长三角中心,具备显著的产业与区位优势。

具身智能领军学者苏昊加盟复旦,领衔建设通用物理智能研究院

以此为目标,加盟复旦后,苏昊将领衔建设通用物理智能研究院。该研究院将依托复旦大学智能机器人与先进制造创新学院,打破传统院系划分,不设学科边界,完全以问题为导向,汇聚数学、物理、计算机科学、人机交互、脑机接口等多领域的顶尖人才。

他直言,研究院的目标是培养未来5到10年的人工智能领军人物。在人才培养理念上,他特别强调两点:高品位的科研眼光(知道什么问题值得做)和长周期的探索耐心(愿意把问题做深做透)。

论文不是目标,而是副产品。真正的标尺,是能否在真实世界中实现智能体的有效行动与自主决策。

研究院将重构课程体系,缩短学生从基础知识学习到科研前沿探索的路径,让学生尽早进入科研与实践环节,同时大力支持师生创新创业,推动科技成果转化。

对具身智能:乐观,但谨慎

对于当下火热的具身智能赛道,苏昊的判断是“谨慎的乐观”。

乐观的底气来自于问题本身,因为这是一个兼具科学深度与巨大产业潜力的真问题。谨慎则源于现实挑战,因为当前大量精彩的演示与真正的通用能力之间,仍存在关键断层。而填补这一断层的核心,正是物理智能。

具身智能领军学者苏昊加盟复旦,领衔建设通用物理智能研究院

谈及“具身智能的ChatGPT时刻”,苏昊坦言,短期内实现像大语言模型那样的高度泛化能力还不现实,但在更长时间尺度上,发展方向是清晰的。

他预见,具身智能将深度渗透制造业、服务业、养老行业等诸多领域,最终推动人类社会进入“人机正面互动、人机共存的时代”。而通往那一未来的桥梁,正建立在今天对物理智能扎实而深入的探索之上。

苏昊的学术旅程从中国出发,一路从2D视觉拓展到3D视觉,再从视觉感知延伸到具身智能,逐步打通了“让机器理解世界”的关键路径。如今,他带着丰厚的积淀归来,落脚复旦大学,直面物理智能这道终极难题。世界级人工智能科学家的加盟,也将复旦大学在人工智能与具身智能领域的研究推向了世界最前沿。

谁会代表2026年的AI?

龙虾爆火,带动一波Agent与衍生产品浪潮。但真正值得长期关注的AI公司和产品,或许不止于此。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/30757

(0)
上一篇 4小时前
下一篇 4小时前

相关推荐

  • MEET2026智能未来大会深度解析:从大模型到智能体,AI产业变革的十字路口

    在2025年这个AI发展的关键节点,MEET2026智能未来大会如同一面镜子,清晰地映照出人工智能领域正在发生的深刻变革。这场汇聚了学术界、工业界和投资界顶尖智慧的盛会,不仅展示了当前AI技术的最新进展,更揭示了未来几年的发展方向与挑战。 从大会的整体氛围来看,AI产业正处在一个前所未有的活跃期。会场内座无虚席的景象,线上直播高达350万+的观看量,都充分说…

    2025年12月11日
    40800
  • 硅谷容貌革命:科技从业者医美潮背后的年龄焦虑与行业变革

    在科技创新的前沿阵地硅谷,一场静默的容貌革命正在悄然兴起。加州整形外科医生的最新数据显示,过去五年间,来自科技行业的男性求美者数量激增五倍,其中大厂中年程序员成为主力军。这一现象不仅揭示了科技从业者日益加剧的年龄焦虑,更折射出全球科技行业在AI时代下面临的结构性挑战。 深入分析这一趋势,首先需要关注医美项目的具体变化。根据硅谷整形外科医生本·塔莱博士的观察,…

    2025年11月7日
    31100
  • 阿里Qwen3.5小模型震撼发布:0.8B参数即可处理视频,边缘AI时代正式开启!

    阿里通义千问发布了Qwen3.5系列的四款小参数规模模型,分别为0.8B、2B、4B和9B。该系列的核心创新在于引入了Gated DeltaNet混合注意力机制,此项技术借鉴自其397B参数的大模型。 该架构采用三层线性注意力层对应一层全注意力层的设计。线性层负责常规计算,内存占用保持恒定;全注意力层仅在需要精确计算时激活。这种3:1的配比使得模型在维持高质…

    2026年3月3日
    57500
  • 京东AI解法:开源JoyAI-LLM Flash降本增效,数字人性能超SOTA,具身智能覆盖百品牌

    京东AI解法:开源JoyAI-LLM Flash降本增效,数字人性能超SOTA,具身智能覆盖百品牌 AI技术加速迭代,但成本效率与性能的平衡、产业落地“最后一公里”的打通,仍是行业面临的共性挑战。3月24日,京东公布了其AI研发应用的部分阶段性进展,提出了针对上述难题的解决方案。 01 开源大模型JoyAI-LLM Flash,大幅降低AI使用门槛 在模型能…

    2026年3月25日
    29000
  • 深度解析Depth Anything 3:单Transformer统一3D视觉任务,字节跳动如何重塑几何感知新范式

    在计算机视觉领域,3D重建与几何感知一直是核心挑战之一。传统方法往往需要针对不同任务设计专用模型,如单目深度估计、多视角重建、相机姿态估计等,这不仅增加了开发复杂度,也限制了模型的泛化能力与数据利用效率。近日,字节跳动Seed团队的Depth Anything 3(DA3)研究成果,以单一Transformer架构统一了多种3D视觉任务,在视觉几何基准上取得…

    2025年11月18日
    28600