硅谷种子轮最大融资1.05亿美元，Genesis发布首个机器人基础模型GENE-26.5，自主完成20步烹饪、解魔方、弹钢琴

那个凭借一句话就能生成完整物理世界、并打造出 GitHub 上最大开源机器人项目的团队，如今再次带来了新动作。

硅谷种子轮最大融资1.05亿美元，Genesis发布首个机器人基础模型GENE-26.5，自主完成20步烹饪、解魔方、弹钢琴

去年年底，Genesis 物理引擎正式开源后，迅速在机器人领域引发轰动：用户只需输入一句话，便能生成一个可交互的物理世界，用于机器人的训练与测试。

如今，这家创下硅谷具身智能赛道最大种子轮融资纪录（高达 1.05 亿美元）的 Genesis AI，终于揭开了其首个机器人基础模型 GENE-26.5 的神秘面纱。

该模型能够自主完成一项包含 20 多个步骤的烹饪任务，还能解魔方、弹钢琴、制作奶昔、操作实验室移液、整理线束等。这些任务不仅涉及长时序操作，还需要精细的力控、双手协调、手内操作（in-hand manipulation）以及工具使用能力，远超许多机器人演示中常见的简单抓取或重复性动作。更关键的是，这一切都是完全自主完成的，并且以 1x 真实速度播放。

Genesis 强调，这些任务并非为单一场景单独设计，而是由同一个模型、同一套硬件平台、同一套数据策略以及同一套控制栈协同完成的。

视频一经发布，立刻在网络上引发刷屏热潮，也让众多机器人从业者感到震撼。

Eclipse Ventures 的合伙人 Seth Winterroth 在社交平台上直言，自己在机器人行业前沿深耕了十多年，几乎见过过去几年所有声称实现「通用操作能力」突破的团队。

然而，Genesis 所展示的成果，「与自己之前见过的完全不在一个量级」。

硅谷种子轮最大融资1.05亿美元，Genesis发布首个机器人基础模型GENE-26.5，自主完成20步烹饪、解魔方、弹钢琴

GENE-26.5 能做什么？

在官方演示中，最具代表性的任务是烹饪。

这是一个大约 4 分钟的长程任务，包含 20 多个子任务。机器人需要单手打蛋、切番茄、使用毛巾、盐磨、打蛋器、刀、锅铲、煎锅等多种工具，并完成双手协同操作。

另一个更接近商业化应用的场景是实验室移液。

机器人需要抓取移液枪、插入枪头、转移液体、密封试管、按下离心机的小按钮，再将试管放入转子中。整个流程要求毫米级精度、工具使用、精细的手部协调能力，以及对小尺寸物体的稳定操作。

还有一个既炫技又极具说服力的任务：解魔方。Genesis 声称，这是他们所知的首次有通用双手机器人系统成功完成魔方求解。它并非依赖特殊机械夹具，而是通过外部求解器生成动作指令，再由模型执行。

他们甚至让机器人挑战了以高难度著称的 Rush E 钢琴曲，这首曲子超出了普通人类的演奏极限。不久前，郎朗在巴黎里昂车站与钢琴博主斗琴时，演奏的正是这首曲子。

在工业场景中，则包括线束整理。这被 Genesis 称为汽车行业的圣杯任务之一，因为线缆、胶带等软体物体极难处理，需要双手协同、柔性物体控制以及精确缠绕。

更关键的是，对于演示任务中的大多数挑战性技能，GENE 仅需不到 1 小时的任务特定机器人数据。对于 20 秒以内的技能，这相当于少于 200 条 episode 的数据量。

这正是 Genesis 希望证明的能力：并非每个任务都从零开始训练，而是让机器人越来越接近只需少量数据即可快速部署的状态。

并非仅仅把模型训大

然而，Genesis 并不认为通用操作能力能单纯通过「把模型训大」直接实现。

Genesis 联合创始人兼 CEO 周衔表示：

模型始终是目标，因为更好的模型意味着更智能的表现。

但他们很快意识到，仅靠模型是不够的。机器人并非纯数字 AI，它需要模型、传感器、执行器、控制系统、数据采集以及评测体系协同工作。

任何一层不够强大，都会拖累整体表现。

因此，Genesis 选择了全栈路线。GENE-26.5 并非一个孤立的模型，而是一整套系统，包括：

接近人手的机器人硬件
低成本人类数据采集体系
从零构建的仿真评测栈
面向机器人的多模态基础模型
低延迟高精度控制系统

这就是 Genesis 所说的 full-stack robotics。

仿真：模型迭代的加速器

机器人模型还面临一个老问题：评测速度太慢。一个机器人、一名人类评估员，一次只能运行一个任务。每次模型 checkpoint 都需要实机测试，效率极低。

Genesis 的解决方案，是将仿真系统作为闭环评测的核心。

他们认为，真实世界评测固然重要，但仿真在可控性、可复现性和规模化方面具有巨大优势。在 GENE-26.5 的开发过程中，Genesis 构建了大量仿真评测任务，覆盖了不同的光照、背景、物体属性、场景配置和任务指令。

硅谷种子轮最大融资1.05亿美元，Genesis发布首个机器人基础模型GENE-26.5，自主完成20步烹饪、解魔方、弹钢琴

官方给出的一个说法是：图中的每个数据点都代表 200 个评测设置、超过 150 小时的机器人执行时间；如果放到真实世界中，整张图需要 2700 小时的人机评测。

这也是他们去年开源 Genesis 物理引擎的意义所在。仿真不仅是展示工具，更是机器人基础模型迭代的加速器。

一双「人手」为何如此重要？

其新一代 Genesis Hand 1.0，被设计成与人手 1:1 的尺寸匹配，拥有 20 个主动、可反驱自由度，手掌和手指覆盖柔性材料，用于模拟人类皮肤的软接触特性。

硅谷种子轮最大融资1.05亿美元，Genesis发布首个机器人基础模型GENE-26.5，自主完成20步烹饪、解魔方、弹钢琴

为何一定要做人形手？今天许多机器人公司仍在使用两指夹爪，因为它简单、稳定、工程上易于控制。但问题也很明显：它与人类真实操作世界的方式相差甚远。

Genesis 的判断是，如果机器人手能尽可能接近人手，就能大幅缩小机器人研究中常说的「具身差距」。这样一来，人类日常工作中的动作数据，就更容易迁移到机器人身上。

这也是 Genesis 自研机器人手的核心逻辑：并非为了炫技，而是为了收集更多可用的数据。

公司联合创始人 Théophile Gervet 表示，接近人手的设计可以让他们收集到比过去更多的数据，从而训练出能完成更多任务的模型。

真正的关键：那只数据手套

在技术博客中，Genesis 反复强调一个观点：世界上最有价值的物理技能，藏在人类双手的隐性知识里。

装配工的手感、实验员的精度、厨师的速度——这些能力过去几乎没有被系统记录下来。为此，Genesis 构建了一个以人为中心的数据引擎，主要包括三类数据：

一类是手套数据，采集高精度手部运动和触觉信号；
一类是第一视角视频，记录真实任务中的自然行为；
还有一类是第三视角视频，利用互联网规模数据覆盖更多物理交互场景。

硅谷种子轮最大融资1.05亿美元，Genesis发布首个机器人基础模型GENE-26.5，自主完成20步烹饪、解魔方、弹钢琴

其中最关键的，是他们自研的数据采集手套。这只手套采用 EMF 手指追踪和密集触觉传感技术，可以在不显著干扰人类工作的情况下，将真实工作过程转化为机器人训练数据。

Genesis 的设想是，未来实验室技师、制造业工人等都可以在正常工作时佩戴这种手套。相比笨重的数据采集设备，它更轻、更便宜，也更接近许多行业原本就在使用的安全手套。

这也是 Genesis 提出的通用操作扩展路径：先在人类演示数据上预训练，再用少量机器人数据对齐，最后通过真实世界和仿真反馈持续迭代。

不过，这里也存在一个现实问题：工人是否愿意戴着手套和摄像头，去训练未来可能替代自己的机器人？

Genesis 方面目前尚未给出明确答案，仅表示相关细节还未完全确定，是否额外支付报酬也将由客户和员工之间自行决定。

硅谷种子轮最大融资1.05亿美元，Genesis发布首个机器人基础模型GENE-26.5，自主完成20步烹饪、解魔方、弹钢琴

这些实验成果共同揭示了一个清晰的发展方向：扩大数据规模与计算能力，能够显著提升机器人的泛化性能与适应效率。

为了让模型真正听指挥，他们彻底重构了控制栈

Genesis 在博客中还披露了一个容易被忽视但至关重要的技术细节：他们摒弃了双臂机器人自带的原厂控制器，自行设计并实现了一套全新的控制中间件。

原因在于，当机器人执行动作时，模型输出的指令与真实电机的物理运动之间，会不断累积延迟、跟踪误差以及控制器产生的伪影。

对于通过模仿人类动作进行学习的机器人而言，这些误差会进一步放大人类与机器之间的能力鸿沟。

在采用自研控制系统后，Genesis 的端到端延迟最低可压缩至 3 毫秒。在 15 厘米圆形轨迹跟踪测试中，原厂控制器的平均误差约为 20 毫米，而他们的新系统将误差降至约 2 毫米，相当于性能提升了整整一个数量级。

硅谷种子轮最大融资1.05亿美元，Genesis发布首个机器人基础模型GENE-26.5，自主完成20步烹饪、解魔方、弹钢琴

上图展示了 Genesis AI 自研硬件与模型在控制精度上，相较于现成解决方案（Off-the-shelf）的显著优势。

这也就解释了为何 Genesis 反复强调「全栈」理念。这并非为了讲述一个动听的技术故事，而是在机器人领域，模型、硬件、控制、数据与评测这五大环节必须协同运作、缺一不可。

下一个目标：不止于手，而是全身机器人

GENE-26.5 这个命名也暗藏玄机：其中的数字 26.5 指向 2026 年 5 月。

Genesis 表示，这仅仅是第一个版本，后续会快速迭代。公司认为，机器人模型迭代的真正瓶颈在于评估环节，而他们自研的仿真系统恰好能够加速训练与测试的闭环。

总而言之，GENE-26.5 并非 Genesis 的终点，更像是它向外界展示的第一张系统能力名片。它试图证明：通用机器人的发展路径，并非先学会行走，再慢慢学会操作。

相反，真正有价值的切入点，或许是一双能够稳定、灵巧且具备泛化能力，与物理世界进行交互的手。

因为绝大多数体力劳动，本质上并非机器人在空间中的移动，而是对世界的改变。导航可以将世界简化为障碍物与可通行区域；行走主要处理与地面的接触，其规律相对固定。

但操作则截然不同。机器人需要面对未知物体的形状、重量、摩擦力以及动态变化，还要在长任务链中维持毫米级的精度。一个动作偏差几毫米，后续所有步骤都可能全盘出错。

因此，Genesis 认为，如果机器人能够可靠地与物理世界发生复杂的接触，那么其他能力才有发挥价值的空间。

Genesis 的技术路线也十分清晰：借助接近人手的硬件来缩小具身智能的差距；利用人类工作数据来扩大训练规模；通过仿真系统加速闭环评估；依靠低延迟控制来减少执行误差；最后，将所有这一切整合进机器人基础模型。

难怪投资人们将其称为「最强通用操作演示」。

公司下一步还计划发布首款通用机器人，而且并非仅有一双手，而是完整的全身机器人。换句话说，Genesis 此次展示的并非终点，而是一记漂亮的起手式。

在机器人领域，一个实力强劲的新玩家已经亮出了底牌。

参考链接
https://www.genesis.ai/blog/gene-26-5-advancing-robotic-manipulation-to-human-level

关注“鲸栖”小程序，掌握最新AI资讯

本文来自网络搜集，不代表鲸林向海立场，如有侵权，联系删除。转载请注明出处：https://www.itsolotime.com/archives/33563

硅谷种子轮最大融资1.05亿美元，Genesis发布首个机器人基础模型GENE-26.5，自主完成20步烹饪、解魔方、弹钢琴

相关推荐

DeepSeek-V4来了：百万上下文标配，华为算力下半年上线

GPT-5.6与Jupiter同日曝光！OpenAI和Anthropic的下一代模型军备竞赛加速

告别人工规则！阿里巴巴AgeMem：让LLM通过强化学习自主管理记忆，统一长短期记忆处理

AI巨头混战升级：从单点突破到生态闭环的战略博弈

Meta揭秘：保障万亿参数AI模型稳定训练的硬件可靠性之战