硅谷种子轮最大融资1.05亿美元,Genesis发布首个机器人基础模型GENE-26.5,自主完成20步烹饪、解魔方、弹钢琴

那个凭借一句话就能生成完整物理世界、并打造出 GitHub 上最大开源机器人项目的团队,如今再次带来了新动作。

硅谷种子轮最大融资1.05亿美元,Genesis发布首个机器人基础模型GENE-26.5,自主完成20步烹饪、解魔方、弹钢琴

去年年底,Genesis 物理引擎正式开源后,迅速在机器人领域引发轰动:用户只需输入一句话,便能生成一个可交互的物理世界,用于机器人的训练与测试。

如今,这家创下硅谷具身智能赛道最大种子轮融资纪录(高达 1.05 亿美元)的 Genesis AI,终于揭开了其首个机器人基础模型 GENE-26.5 的神秘面纱。

该模型能够自主完成一项包含 20 多个步骤的烹饪任务,还能解魔方、弹钢琴、制作奶昔、操作实验室移液、整理线束等。这些任务不仅涉及长时序操作,还需要精细的力控、双手协调、手内操作(in-hand manipulation)以及工具使用能力,远超许多机器人演示中常见的简单抓取或重复性动作。更关键的是,这一切都是完全自主完成的,并且以 1x 真实速度播放。

Genesis 强调,这些任务并非为单一场景单独设计,而是由同一个模型、同一套硬件平台、同一套数据策略以及同一套控制栈协同完成的。

视频一经发布,立刻在网络上引发刷屏热潮,也让众多机器人从业者感到震撼。

Eclipse Ventures 的合伙人 Seth Winterroth 在社交平台上直言,自己在机器人行业前沿深耕了十多年,几乎见过过去几年所有声称实现「通用操作能力」突破的团队。

然而,Genesis 所展示的成果,「与自己之前见过的完全不在一个量级」。

硅谷种子轮最大融资1.05亿美元,Genesis发布首个机器人基础模型GENE-26.5,自主完成20步烹饪、解魔方、弹钢琴

硅谷种子轮最大融资1.05亿美元,Genesis发布首个机器人基础模型GENE-26.5,自主完成20步烹饪、解魔方、弹钢琴

硅谷种子轮最大融资1.05亿美元,Genesis发布首个机器人基础模型GENE-26.5,自主完成20步烹饪、解魔方、弹钢琴

硅谷种子轮最大融资1.05亿美元,Genesis发布首个机器人基础模型GENE-26.5,自主完成20步烹饪、解魔方、弹钢琴

硅谷种子轮最大融资1.05亿美元,Genesis发布首个机器人基础模型GENE-26.5,自主完成20步烹饪、解魔方、弹钢琴

硅谷种子轮最大融资1.05亿美元,Genesis发布首个机器人基础模型GENE-26.5,自主完成20步烹饪、解魔方、弹钢琴

GENE-26.5 能做什么?

在官方演示中,最具代表性的任务是烹饪。

这是一个大约 4 分钟的长程任务,包含 20 多个子任务。机器人需要单手打蛋、切番茄、使用毛巾、盐磨、打蛋器、刀、锅铲、煎锅等多种工具,并完成双手协同操作。

另一个更接近商业化应用的场景是实验室移液。

机器人需要抓取移液枪、插入枪头、转移液体、密封试管、按下离心机的小按钮,再将试管放入转子中。整个流程要求毫米级精度、工具使用、精细的手部协调能力,以及对小尺寸物体的稳定操作。

还有一个既炫技又极具说服力的任务:解魔方。Genesis 声称,这是他们所知的首次有通用双手机器人系统成功完成魔方求解。它并非依赖特殊机械夹具,而是通过外部求解器生成动作指令,再由模型执行。

他们甚至让机器人挑战了以高难度著称的 Rush E 钢琴曲,这首曲子超出了普通人类的演奏极限。不久前,郎朗在巴黎里昂车站与钢琴博主斗琴时,演奏的正是这首曲子。

在工业场景中,则包括线束整理。这被 Genesis 称为汽车行业的圣杯任务之一,因为线缆、胶带等软体物体极难处理,需要双手协同、柔性物体控制以及精确缠绕。

更关键的是,对于演示任务中的大多数挑战性技能,GENE 仅需不到 1 小时的任务特定机器人数据。对于 20 秒以内的技能,这相当于少于 200 条 episode 的数据量。

这正是 Genesis 希望证明的能力:并非每个任务都从零开始训练,而是让机器人越来越接近只需少量数据即可快速部署的状态。

并非仅仅把模型训大

然而,Genesis 并不认为通用操作能力能单纯通过「把模型训大」直接实现。

Genesis 联合创始人兼 CEO 周衔表示:

模型始终是目标,因为更好的模型意味着更智能的表现。

但他们很快意识到,仅靠模型是不够的。机器人并非纯数字 AI,它需要模型、传感器、执行器、控制系统、数据采集以及评测体系协同工作。

任何一层不够强大,都会拖累整体表现。

因此,Genesis 选择了全栈路线。GENE-26.5 并非一个孤立的模型,而是一整套系统,包括:

  • 接近人手的机器人硬件
  • 低成本人类数据采集体系
  • 从零构建的仿真评测栈
  • 面向机器人的多模态基础模型
  • 低延迟高精度控制系统

这就是 Genesis 所说的 full-stack robotics。

仿真:模型迭代的加速器

机器人模型还面临一个老问题:评测速度太慢。一个机器人、一名人类评估员,一次只能运行一个任务。每次模型 checkpoint 都需要实机测试,效率极低。

Genesis 的解决方案,是将仿真系统作为闭环评测的核心。

他们认为,真实世界评测固然重要,但仿真在可控性、可复现性和规模化方面具有巨大优势。在 GENE-26.5 的开发过程中,Genesis 构建了大量仿真评测任务,覆盖了不同的光照、背景、物体属性、场景配置和任务指令。

硅谷种子轮最大融资1.05亿美元,Genesis发布首个机器人基础模型GENE-26.5,自主完成20步烹饪、解魔方、弹钢琴

官方给出的一个说法是:图中的每个数据点都代表 200 个评测设置、超过 150 小时的机器人执行时间;如果放到真实世界中,整张图需要 2700 小时的人机评测。

这也是他们去年开源 Genesis 物理引擎的意义所在。仿真不仅是展示工具,更是机器人基础模型迭代的加速器。

一双「人手」为何如此重要?

其新一代 Genesis Hand 1.0,被设计成与人手 1:1 的尺寸匹配,拥有 20 个主动、可反驱自由度,手掌和手指覆盖柔性材料,用于模拟人类皮肤的软接触特性。

硅谷种子轮最大融资1.05亿美元,Genesis发布首个机器人基础模型GENE-26.5,自主完成20步烹饪、解魔方、弹钢琴

硅谷种子轮最大融资1.05亿美元,Genesis发布首个机器人基础模型GENE-26.5,自主完成20步烹饪、解魔方、弹钢琴

为何一定要做人形手?今天许多机器人公司仍在使用两指夹爪,因为它简单、稳定、工程上易于控制。但问题也很明显:它与人类真实操作世界的方式相差甚远。

Genesis 的判断是,如果机器人手能尽可能接近人手,就能大幅缩小机器人研究中常说的「具身差距」。这样一来,人类日常工作中的动作数据,就更容易迁移到机器人身上。

这也是 Genesis 自研机器人手的核心逻辑:并非为了炫技,而是为了收集更多可用的数据。

公司联合创始人 Théophile Gervet 表示,接近人手的设计可以让他们收集到比过去更多的数据,从而训练出能完成更多任务的模型。

真正的关键:那只数据手套

在技术博客中,Genesis 反复强调一个观点:世界上最有价值的物理技能,藏在人类双手的隐性知识里。

装配工的手感、实验员的精度、厨师的速度——这些能力过去几乎没有被系统记录下来。为此,Genesis 构建了一个以人为中心的数据引擎,主要包括三类数据:

  • 一类是手套数据,采集高精度手部运动和触觉信号;
  • 一类是第一视角视频,记录真实任务中的自然行为;
  • 还有一类是第三视角视频,利用互联网规模数据覆盖更多物理交互场景。

硅谷种子轮最大融资1.05亿美元,Genesis发布首个机器人基础模型GENE-26.5,自主完成20步烹饪、解魔方、弹钢琴

其中最关键的,是他们自研的数据采集手套。这只手套采用 EMF 手指追踪和密集触觉传感技术,可以在不显著干扰人类工作的情况下,将真实工作过程转化为机器人训练数据。

Genesis 的设想是,未来实验室技师、制造业工人等都可以在正常工作时佩戴这种手套。相比笨重的数据采集设备,它更轻、更便宜,也更接近许多行业原本就在使用的安全手套。

这也是 Genesis 提出的通用操作扩展路径:先在人类演示数据上预训练,再用少量机器人数据对齐,最后通过真实世界和仿真反馈持续迭代。

不过,这里也存在一个现实问题:工人是否愿意戴着手套和摄像头,去训练未来可能替代自己的机器人?

Genesis 方面目前尚未给出明确答案,仅表示相关细节还未完全确定,是否额外支付报酬也将由客户和员工之间自行决定。

硅谷种子轮最大融资1.05亿美元,Genesis发布首个机器人基础模型GENE-26.5,自主完成20步烹饪、解魔方、弹钢琴

硅谷种子轮最大融资1.05亿美元,Genesis发布首个机器人基础模型GENE-26.5,自主完成20步烹饪、解魔方、弹钢琴

硅谷种子轮最大融资1.05亿美元,Genesis发布首个机器人基础模型GENE-26.5,自主完成20步烹饪、解魔方、弹钢琴

这些实验成果共同揭示了一个清晰的发展方向:扩大数据规模与计算能力,能够显著提升机器人的泛化性能与适应效率。

为了让模型真正听指挥,他们彻底重构了控制栈

Genesis 在博客中还披露了一个容易被忽视但至关重要的技术细节:他们摒弃了双臂机器人自带的原厂控制器,自行设计并实现了一套全新的控制中间件。

原因在于,当机器人执行动作时,模型输出的指令与真实电机的物理运动之间,会不断累积延迟、跟踪误差以及控制器产生的伪影。

对于通过模仿人类动作进行学习的机器人而言,这些误差会进一步放大人类与机器之间的能力鸿沟。

在采用自研控制系统后,Genesis 的端到端延迟最低可压缩至 3 毫秒。在 15 厘米圆形轨迹跟踪测试中,原厂控制器的平均误差约为 20 毫米,而他们的新系统将误差降至约 2 毫米,相当于性能提升了整整一个数量级。

硅谷种子轮最大融资1.05亿美元,Genesis发布首个机器人基础模型GENE-26.5,自主完成20步烹饪、解魔方、弹钢琴

上图展示了 Genesis AI 自研硬件与模型在控制精度上,相较于现成解决方案(Off-the-shelf)的显著优势。

这也就解释了为何 Genesis 反复强调「全栈」理念。这并非为了讲述一个动听的技术故事,而是在机器人领域,模型、硬件、控制、数据与评测这五大环节必须协同运作、缺一不可。

下一个目标:不止于手,而是全身机器人

GENE-26.5 这个命名也暗藏玄机:其中的数字 26.5 指向 2026 年 5 月。

Genesis 表示,这仅仅是第一个版本,后续会快速迭代。公司认为,机器人模型迭代的真正瓶颈在于评估环节,而他们自研的仿真系统恰好能够加速训练与测试的闭环。

总而言之,GENE-26.5 并非 Genesis 的终点,更像是它向外界展示的第一张系统能力名片。它试图证明:通用机器人的发展路径,并非先学会行走,再慢慢学会操作。

相反,真正有价值的切入点,或许是一双能够稳定、灵巧且具备泛化能力,与物理世界进行交互的手。

因为绝大多数体力劳动,本质上并非机器人在空间中的移动,而是对世界的改变。导航可以将世界简化为障碍物与可通行区域;行走主要处理与地面的接触,其规律相对固定。

但操作则截然不同。机器人需要面对未知物体的形状、重量、摩擦力以及动态变化,还要在长任务链中维持毫米级的精度。一个动作偏差几毫米,后续所有步骤都可能全盘出错。

因此,Genesis 认为,如果机器人能够可靠地与物理世界发生复杂的接触,那么其他能力才有发挥价值的空间。

Genesis 的技术路线也十分清晰:借助接近人手的硬件来缩小具身智能的差距;利用人类工作数据来扩大训练规模;通过仿真系统加速闭环评估;依靠低延迟控制来减少执行误差;最后,将所有这一切整合进机器人基础模型。

难怪投资人们将其称为「最强通用操作演示」。

公司下一步还计划发布首款通用机器人,而且并非仅有一双手,而是完整的全身机器人。换句话说,Genesis 此次展示的并非终点,而是一记漂亮的起手式。

在机器人领域,一个实力强劲的新玩家已经亮出了底牌。

参考链接
https://www.genesis.ai/blog/gene-26-5-advancing-robotic-manipulation-to-human-level


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/33563

(0)
上一篇 6天前
下一篇 5天前

相关推荐

  • DeepSeek-V4来了:百万上下文标配,华为算力下半年上线

    刚刚,DeepSeek-V4来了! 预览版正式上线并同步开源。 一共两个版本: DeepSeek-V4-Pro:对标顶级闭源模型,1.6T,49B激活,上下文长度1M; DeepSeek-V4-Flash:更小更快的经济版,284B,13B激活,上下文长度1M。 官方原话是:在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。 并且: 目前De…

    2026年4月24日
    36600
  • GPT-5.6与Jupiter同日曝光!OpenAI和Anthropic的下一代模型军备竞赛加速

    GPT-5.5的热度尚未消退,OpenAI的后台就露出了马脚。 昨天,有开发者在Codex内部日志中发现了一条异常记录。绝大多数API调用走的是GPT-5.5,但有一条路由映射赫然写着「gpt-5.6」。 这不是正式发布,更像是后端的金丝雀测试。也就是说,OpenAI正在用真实流量悄悄喂养下一代模型。 GPT-5.6已经在运行了。 几乎在同一时间,Anthr…

    2026年5月2日
    92400
  • 告别人工规则!阿里巴巴AgeMem:让LLM通过强化学习自主管理记忆,统一长短期记忆处理

    大型语言模型在处理长对话或多步复杂任务时,最头疼的就是记忆管理问题。现有的方法往往采用人工设定的规则来决定哪些信息该存、哪些该删,效果有限且不够灵活。 阿里巴巴团队最近在论文《Agentic Memory: Learning Unified Long-Term and Short-Term Memory Management for Large Langua…

    2026年1月10日
    73100
  • AI巨头混战升级:从单点突破到生态闭环的战略博弈

    近日,全球科技巨头在AI应用领域的竞争态势骤然升级,阿里、谷歌、腾讯相继公布重大战略调整,标志着AI应用竞争已从技术探索阶段进入全面生态布局的实战阶段。这三家企业在同一天内释放的关键信号,看似各自为战,实则共同指向一个核心趋势:AI智能体正成为重构互联网服务生态的关键变量,而争夺端到端用户服务闭环已成为巨头们的共同战略目标。 首先聚焦阿里。据彭博社等多家权威…

    2025年11月14日
    33200
  • Meta揭秘:保障万亿参数AI模型稳定训练的硬件可靠性之战

    关键词:AI 硬件可靠性、沉默数据损坏(SDC)、故障检测机制、硬件故障缓解、Meta 硬件故障会对 AI 训练和推理产生重大影响。 静默数据损坏(SDC,指由硬件导致、未被检测到的数据错误)对 AI 系统的危害尤为严重——这类系统无论是训练过程还是生成有用输出,都依赖于准确的数据。 本文将分享 Meta 在不同规模下,为检测 AI 和非 AI 基础设施中的…

    2026年1月29日
    50400