那个凭借一句话就能生成完整物理世界、并打造出 GitHub 上最大开源机器人项目的团队,如今再次带来了新动作。

去年年底,Genesis 物理引擎正式开源后,迅速在机器人领域引发轰动:用户只需输入一句话,便能生成一个可交互的物理世界,用于机器人的训练与测试。
如今,这家创下硅谷具身智能赛道最大种子轮融资纪录(高达 1.05 亿美元)的 Genesis AI,终于揭开了其首个机器人基础模型 GENE-26.5 的神秘面纱。
该模型能够自主完成一项包含 20 多个步骤的烹饪任务,还能解魔方、弹钢琴、制作奶昔、操作实验室移液、整理线束等。这些任务不仅涉及长时序操作,还需要精细的力控、双手协调、手内操作(in-hand manipulation)以及工具使用能力,远超许多机器人演示中常见的简单抓取或重复性动作。更关键的是,这一切都是完全自主完成的,并且以 1x 真实速度播放。
Genesis 强调,这些任务并非为单一场景单独设计,而是由同一个模型、同一套硬件平台、同一套数据策略以及同一套控制栈协同完成的。
视频一经发布,立刻在网络上引发刷屏热潮,也让众多机器人从业者感到震撼。
Eclipse Ventures 的合伙人 Seth Winterroth 在社交平台上直言,自己在机器人行业前沿深耕了十多年,几乎见过过去几年所有声称实现「通用操作能力」突破的团队。
然而,Genesis 所展示的成果,「与自己之前见过的完全不在一个量级」。






GENE-26.5 能做什么?
在官方演示中,最具代表性的任务是烹饪。
这是一个大约 4 分钟的长程任务,包含 20 多个子任务。机器人需要单手打蛋、切番茄、使用毛巾、盐磨、打蛋器、刀、锅铲、煎锅等多种工具,并完成双手协同操作。
另一个更接近商业化应用的场景是实验室移液。
机器人需要抓取移液枪、插入枪头、转移液体、密封试管、按下离心机的小按钮,再将试管放入转子中。整个流程要求毫米级精度、工具使用、精细的手部协调能力,以及对小尺寸物体的稳定操作。
还有一个既炫技又极具说服力的任务:解魔方。Genesis 声称,这是他们所知的首次有通用双手机器人系统成功完成魔方求解。它并非依赖特殊机械夹具,而是通过外部求解器生成动作指令,再由模型执行。
他们甚至让机器人挑战了以高难度著称的 Rush E 钢琴曲,这首曲子超出了普通人类的演奏极限。不久前,郎朗在巴黎里昂车站与钢琴博主斗琴时,演奏的正是这首曲子。
在工业场景中,则包括线束整理。这被 Genesis 称为汽车行业的圣杯任务之一,因为线缆、胶带等软体物体极难处理,需要双手协同、柔性物体控制以及精确缠绕。
更关键的是,对于演示任务中的大多数挑战性技能,GENE 仅需不到 1 小时的任务特定机器人数据。对于 20 秒以内的技能,这相当于少于 200 条 episode 的数据量。
这正是 Genesis 希望证明的能力:并非每个任务都从零开始训练,而是让机器人越来越接近只需少量数据即可快速部署的状态。
并非仅仅把模型训大
然而,Genesis 并不认为通用操作能力能单纯通过「把模型训大」直接实现。
Genesis 联合创始人兼 CEO 周衔表示:
模型始终是目标,因为更好的模型意味着更智能的表现。
但他们很快意识到,仅靠模型是不够的。机器人并非纯数字 AI,它需要模型、传感器、执行器、控制系统、数据采集以及评测体系协同工作。
任何一层不够强大,都会拖累整体表现。
因此,Genesis 选择了全栈路线。GENE-26.5 并非一个孤立的模型,而是一整套系统,包括:
- 接近人手的机器人硬件
- 低成本人类数据采集体系
- 从零构建的仿真评测栈
- 面向机器人的多模态基础模型
- 低延迟高精度控制系统
这就是 Genesis 所说的 full-stack robotics。
仿真:模型迭代的加速器
机器人模型还面临一个老问题:评测速度太慢。一个机器人、一名人类评估员,一次只能运行一个任务。每次模型 checkpoint 都需要实机测试,效率极低。
Genesis 的解决方案,是将仿真系统作为闭环评测的核心。
他们认为,真实世界评测固然重要,但仿真在可控性、可复现性和规模化方面具有巨大优势。在 GENE-26.5 的开发过程中,Genesis 构建了大量仿真评测任务,覆盖了不同的光照、背景、物体属性、场景配置和任务指令。

官方给出的一个说法是:图中的每个数据点都代表 200 个评测设置、超过 150 小时的机器人执行时间;如果放到真实世界中,整张图需要 2700 小时的人机评测。
这也是他们去年开源 Genesis 物理引擎的意义所在。仿真不仅是展示工具,更是机器人基础模型迭代的加速器。
一双「人手」为何如此重要?
其新一代 Genesis Hand 1.0,被设计成与人手 1:1 的尺寸匹配,拥有 20 个主动、可反驱自由度,手掌和手指覆盖柔性材料,用于模拟人类皮肤的软接触特性。


为何一定要做人形手?今天许多机器人公司仍在使用两指夹爪,因为它简单、稳定、工程上易于控制。但问题也很明显:它与人类真实操作世界的方式相差甚远。
Genesis 的判断是,如果机器人手能尽可能接近人手,就能大幅缩小机器人研究中常说的「具身差距」。这样一来,人类日常工作中的动作数据,就更容易迁移到机器人身上。
这也是 Genesis 自研机器人手的核心逻辑:并非为了炫技,而是为了收集更多可用的数据。
公司联合创始人 Théophile Gervet 表示,接近人手的设计可以让他们收集到比过去更多的数据,从而训练出能完成更多任务的模型。
真正的关键:那只数据手套
在技术博客中,Genesis 反复强调一个观点:世界上最有价值的物理技能,藏在人类双手的隐性知识里。
装配工的手感、实验员的精度、厨师的速度——这些能力过去几乎没有被系统记录下来。为此,Genesis 构建了一个以人为中心的数据引擎,主要包括三类数据:
- 一类是手套数据,采集高精度手部运动和触觉信号;
- 一类是第一视角视频,记录真实任务中的自然行为;
- 还有一类是第三视角视频,利用互联网规模数据覆盖更多物理交互场景。

其中最关键的,是他们自研的数据采集手套。这只手套采用 EMF 手指追踪和密集触觉传感技术,可以在不显著干扰人类工作的情况下,将真实工作过程转化为机器人训练数据。
Genesis 的设想是,未来实验室技师、制造业工人等都可以在正常工作时佩戴这种手套。相比笨重的数据采集设备,它更轻、更便宜,也更接近许多行业原本就在使用的安全手套。
这也是 Genesis 提出的通用操作扩展路径:先在人类演示数据上预训练,再用少量机器人数据对齐,最后通过真实世界和仿真反馈持续迭代。
不过,这里也存在一个现实问题:工人是否愿意戴着手套和摄像头,去训练未来可能替代自己的机器人?
Genesis 方面目前尚未给出明确答案,仅表示相关细节还未完全确定,是否额外支付报酬也将由客户和员工之间自行决定。



这些实验成果共同揭示了一个清晰的发展方向:扩大数据规模与计算能力,能够显著提升机器人的泛化性能与适应效率。
为了让模型真正听指挥,他们彻底重构了控制栈
Genesis 在博客中还披露了一个容易被忽视但至关重要的技术细节:他们摒弃了双臂机器人自带的原厂控制器,自行设计并实现了一套全新的控制中间件。
原因在于,当机器人执行动作时,模型输出的指令与真实电机的物理运动之间,会不断累积延迟、跟踪误差以及控制器产生的伪影。
对于通过模仿人类动作进行学习的机器人而言,这些误差会进一步放大人类与机器之间的能力鸿沟。
在采用自研控制系统后,Genesis 的端到端延迟最低可压缩至 3 毫秒。在 15 厘米圆形轨迹跟踪测试中,原厂控制器的平均误差约为 20 毫米,而他们的新系统将误差降至约 2 毫米,相当于性能提升了整整一个数量级。

上图展示了 Genesis AI 自研硬件与模型在控制精度上,相较于现成解决方案(Off-the-shelf)的显著优势。
这也就解释了为何 Genesis 反复强调「全栈」理念。这并非为了讲述一个动听的技术故事,而是在机器人领域,模型、硬件、控制、数据与评测这五大环节必须协同运作、缺一不可。
下一个目标:不止于手,而是全身机器人
GENE-26.5 这个命名也暗藏玄机:其中的数字 26.5 指向 2026 年 5 月。
Genesis 表示,这仅仅是第一个版本,后续会快速迭代。公司认为,机器人模型迭代的真正瓶颈在于评估环节,而他们自研的仿真系统恰好能够加速训练与测试的闭环。
总而言之,GENE-26.5 并非 Genesis 的终点,更像是它向外界展示的第一张系统能力名片。它试图证明:通用机器人的发展路径,并非先学会行走,再慢慢学会操作。
相反,真正有价值的切入点,或许是一双能够稳定、灵巧且具备泛化能力,与物理世界进行交互的手。
因为绝大多数体力劳动,本质上并非机器人在空间中的移动,而是对世界的改变。导航可以将世界简化为障碍物与可通行区域;行走主要处理与地面的接触,其规律相对固定。
但操作则截然不同。机器人需要面对未知物体的形状、重量、摩擦力以及动态变化,还要在长任务链中维持毫米级的精度。一个动作偏差几毫米,后续所有步骤都可能全盘出错。
因此,Genesis 认为,如果机器人能够可靠地与物理世界发生复杂的接触,那么其他能力才有发挥价值的空间。
Genesis 的技术路线也十分清晰:借助接近人手的硬件来缩小具身智能的差距;利用人类工作数据来扩大训练规模;通过仿真系统加速闭环评估;依靠低延迟控制来减少执行误差;最后,将所有这一切整合进机器人基础模型。
难怪投资人们将其称为「最强通用操作演示」。
公司下一步还计划发布首款通用机器人,而且并非仅有一双手,而是完整的全身机器人。换句话说,Genesis 此次展示的并非终点,而是一记漂亮的起手式。
在机器人领域,一个实力强劲的新玩家已经亮出了底牌。
参考链接
https://www.genesis.ai/blog/gene-26-5-advancing-robotic-manipulation-to-human-level
关注“鲸栖”小程序,掌握最新AI资讯
本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/33563

