Hugging Face桌面机器人Reachy Mini销量破百万美元,中国公司矽递科技成幕后关键

去年,Hugging Face推出了一款名为Reachy Mini的桌面机器人

这款身高28厘米、体重1.5公斤的机器人,在过去大半年里取得了亮眼的成绩:发布后5天内销售额便突破100万美元,累计出货量超过3000台,甚至还登上了黄仁勋在CES的展台

Hugging Face桌面机器人Reachy Mini销量破百万美元,中国公司矽递科技成幕后关键

这一成绩也让更多人意识到,这个被誉为“AI界GitHub”的平台,正将其开源理念带入具身智能的硬件领域。

然而,在这款起售价299美元的机器人背后,一家中国公司扮演了关键角色——矽递科技(Seeed Studio),Reachy Mini正是由其负责生产制造。

矽递科技并非传统的整机机器人厂商。在具身智能产业链中,它更像一个硬件系统平台型公司:深度参与英伟达Jetson计算平台生态,同时提供机器人主控、关节模组、传感器及一系列开源机器人套件,服务于开发者和初创团队。

换言之,当Hugging Face从软件模型平台迈向硬件、当开源社区尝试“软硬结合”时,像矽递这样的公司,正成为连接AI模型、硬件与开发者生态的重要节点。

Hugging Face桌面机器人Reachy Mini销量破百万美元,中国公司矽递科技成幕后关键

在与矽递科技机器人产品线团队的交流中,我们获得了来自机器人硬件制造商视角的产业观察与判断:

  • AI陪伴与具身智能载体并不冲突,机器人的物理形态将在依赖屏幕的产品中脱颖而出。
  • Reachy Mini这类桌面机器人的制造难点与人形机器人不同,涉及声学设计等独特挑战。
  • 低成本机器人的未来分水岭不在于价格,而在于“可达性”。
  • 对具身智能开发而言,“少即是多”,过高的自由度并非必需。
  • 开源的核心意义在于降低门槛。
  • 一个好的机器人演示(Demo)应稳定、可实时互动,并能供开发者延伸,而非单纯的极限运动展示。
  • 遥操作是算法训练的一部分,硬件需考虑与数据需求及训练框架的适配性,不能只关注性能和成本。
  • 数据驱动的具身智能范式正在重新定义硬件。

以下是与矽递科技机器人产品线负责人吴丹、应用工程师朱耀晖的访谈实录(内容经不改变原意的编辑):

Reachy Mini、开源硬件与制造商的具身智能视角

Reachy Mini是什么?

问:如何向不了解机器人的人介绍Reachy Mini?它最核心的能力是什么?

吴丹:Reachy Mini是一个高度开放的桌面机器人。它具备完整的多模态交互能力:通过摄像头和麦克风实现“看”和“听”,并能通过语音和用户对话。其头部拥有九轴运动能力,可通过姿态变化表达状态与情绪,让互动更自然。

对于普通用户,它可以被看作一个具有娱乐和陪伴属性的桌面互动伙伴。同时,它完全开源,支持二次开发,应用场景可不断扩展。

对于了解大模型的开发者而言,它的核心能力依然是多模态交互。它能连接Hugging Face上的各类大模型,适合进行智能体(Agent)等开发。

问:Reachy Mini具体如何进行交互?

朱耀晖:它目前有两个版本。一个是无主控版本,需连接用户自备的电脑或Jetson、树莓派等外部主控设备进行开发或体验。另一个是无线版本,内置树莓派主控,开机即可直接使用。

Hugging Face桌面机器人Reachy Mini销量破百万美元,中国公司矽递科技成幕后关键

定位:是AI陪伴产品,还是具身智能载体?

问:Reachy Mini更应被定义为AI陪伴产品,还是具身智能载体?

吴丹:我们认为它更偏向一个具身智能载体,因为其核心是一个用于构建多模态机器人系统的开放平台。但这与陪伴属性并不冲突。例如,有用户反馈8岁儿童也能自行搭建并玩耍,对他们而言,它就是陪伴产品。

Hugging Face桌面机器人Reachy Mini销量破百万美元,中国公司矽递科技成幕后关键

所以两种定位并存。普通用户可将其作为功能完善的陪伴机器人;开发者则可利用其进行深度扩展开发。

问:作为可能具备陪伴属性的机器人,在设计上是否特别考虑了外观和“萌感”?

吴丹:是的。例如它的“大小眼”设计、可动的头顶触角(天线),以及圆润的机身造型,都融入了可爱元素。此外,由于开源,用户可以通过3D打印轻松改造外观,例如官方团队就曾为其制作过万圣节南瓜造型。

Hugging Face桌面机器人Reachy Mini销量破百万美元,中国公司矽递科技成幕后关键

以及圣诞节主题造型。

Hugging Face桌面机器人Reachy Mini销量破百万美元,中国公司矽递科技成幕后关键

问:如果用户想通过3D打印自制配件,官方会提供支持吗?

朱耀晖:会的。我们会提供3D设计文件,并持续在社区补充相关教程和设计案例。

问:市面上已有许多带屏智能助手提供陪伴体验,为何仍选择机器人形态?最重要的设计取舍是什么?

吴丹:设计团队PollenRobotics(已被Hugging Face收购)认为,我们已被屏幕包围,而屏幕交互缺乏真正的参与感。机器人形态能带来更强的互动体验。例如Reachy Mini的“表情包(emoji)”功能,它会通过转动头部、摆动触角并配合声音来做出反馈。

Hugging Face桌面机器人Reachy Mini销量破百万美元,中国公司矽递科技成幕后关键 网友分享的Reachy Mini互动画面

这种结合动作与声音的回应,比屏幕上的界面变化更能让人感受到互动性。

所以我认为,这代表了人与技术互动方式的一种演进。PollenRobotics 旨在塑造一种更具参与感、互动性,也更人性化的形态。

他们相信,一个迷你机器人的形态不仅需要具有吸引力,还应能传递信任感与好奇心,同时带有亲和、可爱的特质。这实质上是在技术感与亲和力之间寻求一种平衡。

问:它的眼睛和头部都可以活动,相比一般的桌面AI终端,功耗可能更高。这款产品是需要持续插电使用,还是支持充电和无线运行?

吴丹:我们刚才提到,它有两个版本。

一个版本不带主控,需要连接外部设备,例如 Jetson 或用户自己的电脑。这个版本需要插电使用。

另一个是无线版本,内部集成了主控和电池,可以脱离电源线独立运行,无需一直插电。

问:有用户在社交平台分享,购买 Reachy Mini 后需要自己动手组装、下载模型并部署环境。这对许多非技术背景的用户而言,听起来门槛不低。你们是如何在“可玩性”和“易用性”之间取得平衡的?

吴丹:这个问题其实与 Reachy Mini 的设计初衷有关。它最初希望面向那些希望探索开源机器人,尤其是尝试将智能体(Agent)模型集成到机器人中的用户。因此,它既需要具备可开发性,也要兼顾娱乐和日常使用。

在易用性方面,我们实际上做了大量优化。

用户收到产品后,会发现安装说明书非常详尽,整个组装过程大约需要2到3小时,且大部分结构已预装完成,真正需要动手的部分并不复杂。

正如我之前提到的,8岁的孩子也能完成拼装,因此整体难度并不高。从某种角度看,这反而成为一个很好的亲子互动或朋友协作的过程。

此外,在软件层面,它也提供了许多“开箱即用”的应用。

安装完成后,会有一个可视化的用户界面,用户可以直接点击体验。Hugging Face 和 PollenRobotics 也已准备了大量示例应用和教程,帮助用户快速上手。

Hugging Face桌面机器人Reachy Mini销量破百万美元,中国公司矽递科技成幕后关键

至于可玩性,对于开发者用户,我们也非常欢迎他们进行深度探索。

例如,可以接入 OpenClaw,将其打造成语音助手;也可以接入 Home Assistant,使其成为家庭智能家居的管理中枢。

这样一来,Reachy Mini 就不仅仅是一个桌面机器人,而是能够融入家庭或办公场景。

在今年 CES 上,黄仁勋演讲中 Hugging Face 展示的一些演示——例如,询问 Reachy Mini 日程安排,它能根据看到的计划表,通过语音或本地界面反馈给用户——这类能力都可以通过接入多模态大模型来实现。

Hugging Face桌面机器人Reachy Mini销量破百万美元,中国公司矽递科技成幕后关键

因此,我们希望它既能令普通用户轻松体验,也能为开发者提供足够的发挥空间。它的可玩性,正是源于这些开放接口与多模态能力的结合。

它可以融入家庭或办公场景,结合的技术点非常丰富,包括刚才提到的 OpenClaw 多模态大模型、大语言模型,以及 Home Assistant 智能家居系统。

Hugging Face桌面机器人Reachy Mini销量破百万美元,中国公司矽递科技成幕后关键

问:既然它能融入家庭场景,那么重量如何?无线版本可以方便地随手移动吗?

朱耀晖:它其实并不重,不像市面上某些需要固定摆放的人形机器人,它是可以移动的。

重量大约相当于一台笔记本电脑。外壳大部分是塑料件,内部只有少量金属结构和舵机组件,因此整体不会太重。基本上单手就能拿起,无线版本也可以随手携带移动。

桌面机器人制造中的挑战

问:像 Reachy Mini 这种桌面级小型机器人,在制造过程中面临哪些主要挑战?未来的优化方向是什么?

朱耀辉:Reachy Mini 这类小型桌面机器人的挑战,与大型人形机器人并不完全相同,其中一个非常复杂的挑战来自声学设计。

因为它在执行动作时,多个电机会同时运转,舵机齿轮啮合会产生明显的机械噪声。而它又是一台需要与人对话的机器人,其麦克风阵列必须在运动状态下仍能保持清晰的拾音能力。

因此,我们与 Hugging Face 以及 PollenRobotics 共同合作,通过反复的声学实验,从结构设计到算法层面进行了联合优化,以提升整体的降噪能力和音频表现。

最终在我们自研的 ReSpeaker 麦克风阵列上实现了更稳定、清晰的语音体验。该麦克风阵列本身集成了降噪算法,再结合结构减振和算法滤波,才解决了“边运动边聆听”的问题。这实际上是桌面交互机器人一个非常核心的难点。

另一个现实问题是算力与网络依赖。Reachy Mini 本身需要联网调用大模型。即使使用类似树莓派这样的本地计算平台,若要调用云端模型,网络环境依然至关重要。

因此,我们也在探索边缘部署的可能性,例如基于 NVIDIA 平台进行本地推理优化,让部分能力能够在边缘侧完成,从而降低延迟和对网络的依赖。

问:我有一个比较基础的问题。语音模型具体是如何工作的?是等我完整说完一段话后再反馈吗?如果多人同时说话,它能区分指令吗?像敲门声这样的非语音声音,它是否会误识别?它是如何处理这类情况的?

朱耀晖:语音识别系统实际上进行了多层过滤。在嘈杂环境中,它会通过算法提取“概率最高”的那个人声信号,即主要说话人的语音,并尽量排除背景干扰,例如多人交谈、环境噪声、敲门声等。

我们在声学实验室进行了大量的噪声测试,包括环境噪声测试和机器人自身运动噪声测试。Reachy Mini 在运动时,舵机齿轮啮合声是最大的挑战,因为那是持续性的、结构性的噪声,会干扰语音识别。

这个问题起初确实影响显著,后来通过持续的结构优化、算法调校以及降噪策略的叠加,才打磨出当前版本的声学效果。

问:如果用户说话速度不同,它能跟上节奏吗?输出延迟是否有专门优化?

朱耀晖:这与所使用的大模型有关。它可以切换不同的模型。

有些模型参数大、推理时间长,响应自然就慢一些;有些模型是轻量级的,响应速度很快,但准确率可能稍低。

例如,切换到国内的一些小参数模型,输出会非常迅速,但理解能力可能不如大模型强。这本质上是速度与准确率之间的权衡。

它可以自行切换模型,包括国产模型和开源模型,都可以部署。

具身智能开发:少即是多

问:现在不少机器人厂商会搭建类似“应用商店”的平台,用户可以直接下载动作或功能。与那些能翻跟头、跑跳的人形机器人相比,Reachy Mini 的自由度相对有限。在动作能力不那么“炫酷”的情况下,你们如何发挥它的优势,创造不同的玩法?

吴丹:您提到的那些能完成复杂动作的人形机器人,确实越来越强大,视觉效果也很震撼。但从开发者学习和入门的角度来看,我反而认为“少即是多”。

许多复杂动作实际上是通过精细编排的动作序列实现的,它们更侧重于运动控制和硬件能力的展示。

而 Reachy Mini,包括我们之前在 Hugging Face 上推动的一些机器人项目,更强调端到端的学习与执行能力,让机器人结合大模型去完成交互和决策。

如果在 Reachy Mini 上增加手、腿或底盘结构,系统复杂度、开发成本和售价都会显著上升。

它当前的定位,是希望以相对可承受的价格,让更多人——无论年龄、职业或技术背景——都能接触具身智能。如果走向高复杂度的人形形态,价格可能会攀升至上万元,那就偏离了其降低门槛的初衷。

当然,它目前的形态确实不能翻跟头或行走,但通过舵机驱动的头部和触角动作,已经能够完成大部分的情绪表达和互动体验。

当然,底盘和手部,用户如果想添加也可以。但基于它现有的产品形态,我认为其大部分的交互体验已经可以实现。

对于学习机器人原理、进行软件和智能体开发而言,这样的复杂度是足够的。更高的复杂度,往往意味着更高的成本和更高的门槛。

市面上那些能跑能跳的人形机器人,其核心在于运动控制能力,强调电机性能、步态算法和动作编排的流畅度。

而 Reachy Mini 更侧重于让用户体验大模型、智能体(Agent),以及像 OpenClaw 这类能力的接入。

未来,它更多是融入家庭或办公场景,例如接入智能家居系统,承担陪伴或管理功能。因此,我们更强调软件和应用层面的开发,而非极致的运动能力。

另外,关于类似“应用商店”的模式,Reachy Mini 其实也在推进。Hugging Face 已经提供了一个类似应用市场的界面,用户可以直接下载并部署现成的功能。

社区用户开发出一定功能后,也能上传到 Hugging Face 社区。其他用户点击下载,就可以直接体验他人开发的功能。

低成本机器人的分水岭不在价格,在可达性

问: 如何看待当前低成本、开源机器人涌现的趋势?决定性的分水岭是价格、能力、生态还是使用门槛?随着人形机器人价格下降,像Reachy Mini这类桌面机器人将如何定位和发展?

吴丹: 真正的分水岭并非仅仅是价格,而是“可达性”。要让具身智能发展,首先要让机器人更容易被接触和使用。价格低是重要前提,但并非唯一标准。

在早期阶段,关键在于开发者能否真正用起来。平台是否易于开发、足够开放、具有灵活性,这些都比单一的价格更重要。如果只是价格低廉,但系统封闭、扩展性差、交互能力单一,则很难吸引广泛的创新力量。相反,一个足够开放的平台能够吸引更多人参与,共同推动行业生态繁荣。

以Reachy Mini为例,它虽然是桌面形态,但具备扩展能力,例如可以加装底盘或手臂;在软件层面,也能持续接入新的模型和能力。这种软硬件上的扩展性,赋予了产品更长期的生命力。

从行业趋势看,机器人价格必然会越来越有竞争力。随着供应链成熟、规模化量产以及前期试错完成,许多技术将趋向标准化,成本自然下降。但在现阶段,拉开差距的更多是开发友好程度和生态完整度。 Reachy Mini作为全开源产品,在这方面具有优势。

此外,PollenRobotics也强调,一个仅“外观好看”或“动作炫酷”的机器人是远远不够的。即使价格合适,如果缺乏可用性和用户基础,也会面临诸多挑战。因为具身智能最早的一批用户必定是开发者,他们会将机器人真正带入工厂、家庭或商业场景。因此,产品是否对开发者友好、是否容易落地,比单纯展示能力更为重要。

同时,社区的力量至关重要,这也是我们坚持开源的原因。用户不仅可以基于它开发自己的应用,还能在社区中交流、共享成果。这样产品才能持续进化,成为真正的生产力工具。

问: 是否可以理解为:价格昂贵的机器人购买者少,开发者基数小,用户能获得的技术文档和玩法分享也少;而价格便宜的机器人购买者多,社区活跃,用户能从更大的基数中受益?

吴丹: 这个理解不完全准确。价格高确实会阻碍一部分人购买,这是一个现实问题。但价格低本身并非决定性分水岭。 如果一个产品只是便宜,却不开放——文档不完整、软硬件生态封闭、二次开发不便——那么开发者同样很难基于它进行创新。

因此,关键不只是便宜,更在于开发体验要足够好:开放、可拓展,让开发者真正愿意使用、修改并分享成果。简而言之,光有低价还不够,还需要开放性和扩展性。只有这样,社区才会自然成长,生态才能形成正向循环。

开源机器人最大的价值,是降低参与门槛

问: Reachy Mini是一个高度开源的机器人。在你们看来,开源对机器人社区,尤其是具身智能社区,最大的价值是什么?

吴丹: 开源机器人最大的价值,在于降低参与门槛。 具身智能仍是一个非常新的领域,其发展高度依赖更多人参与实验、验证想法并持续迭代创新。这种开放式的参与本身就是推动领域进步的重要力量。

在矽递科技,我们整个AI机器人产品线都秉承这一理念——降低具身智能的开发门槛。这体现在几个方面:
* 产品层面: 提供多种经过工程师严选和验证的产品方案,让开发者能在可靠的基础上直接开发,缩短研发周期。
* 时间成本: 开发者无需从零开始踩坑,可以站在已验证的硬件和系统之上,将精力集中于创新本身。
* 价格: 除了高价的工业机器人,也需要提供大众能够接受的、价格相对可及的产品。
* 教育资源: 提供教程和课程,让不同技术背景的人都能参与进来。

像Reachy Mini或Hugging Face在LeRobot框架下的一系列机器人,能让开发者、研究者和学生完整理解从硬件、软件到AI模型的整个技术栈。这提升了透明度和可复现性,也加快了创新节奏。例如,从组装Reachy Mini的那一刻起,你就能看到它的控制单元、感知单元和推理单元。你不仅能理解“它能做什么”,更能理解“它是如何做到的”。开发者可以在示例模型基础上接入自己的或其他先进模型,真正体验完整的技术栈。

同时,正如我们CEO潘昊以及PollenRobotics CEO Matthieu Lapeyre在之前的访谈中强调的,Reachy Mini的设计理念就是开放和简洁。它采用白色外壳设计,便于快速个性化改造;软件栈与Hugging Face深度集成,开发者只需几行Python代码即可部署AI应用。随着工具进步,很多时候通过更高层级的接口就能完成部署。

问: 对于做大模型的人来说,开源有时会与企业利润产生冲突。在机器人领域,做开源是否与盈利矛盾?如果东西开源了,大家觉得是“免费的”,企业如何赚钱?

吴丹: 首先,开源并不等于没有商业模式。在开源机器人中,零部件清单是公开透明的,大家大致了解成本结构。但企业之间在供应链能力上仍存在差异,包括成本控制、规模化和整合能力。

同时,像Reachy Mini这样的产品,其首要目标并非“利润最大化”,而是让更多开发者参与进来、建立社区。当然,任何产品都需要可持续的模式,不能长期亏损。但Reachy Mini的优先级排序是“生态构建优先”。

矽递科技本身就是一家开源硬件公司,我们理解Hugging Face做开源机器人的初衷。我们的许多产品,包括图纸和PCB设计,都是开源的。我们的思路是:通过开放、经过验证的方案,帮助初创公司或个人团队节省前期开发成本。当他们基于我们的方案做出产品并进入量产阶段时,自然会回来寻求量产合作。因此,开源并非终点,而是一个生态入口。社区用户在平台上创新,最终反哺企业,形成长期合作关系。这是我们一直坚持的方式。

制造商眼中的具身智能

问: 你们认为机器人硬件未来会像PC一样走向标准化,还是会根据不同场景和任务发展出多种形态?

吴丹: 我认为这两种趋势会同时发生。因为这个行业仍处于非常早期的阶段。在此阶段,比起急于完全标准化,更重要的是保持开放、降低门槛,让更多开发者进入该领域。

随着生态逐步成熟,技术栈中的底层模块(如语音识别、感知算法、算力平台以及更稳定可靠的基础模型)一定会趋向标准化和模块化。 在矽递,我们也是从整体系统架构的角度来推荐产品方案,涵盖感知、控制到推理,构成一个完整的技术栈。底层模块未来会越来越标准化。

在应用层面,产品形态必定会保持多样化。 因为场景差异巨大——学校、家庭、医院、办公环境,每个场景的任务目标、交互方式和物理空间都不同,对机器人结构和系统设计的要求自然也不同。Reachy Mini作为一个开放平台,正是为承载这些多样化应用而设计的。开发者可以在一个共享的基础上进行实验、构建,并探索不同的具身智能场景,这个平台从软件到硬件都是可以共享的。

问: 目前最主要的应用场景是什么?

吴丹: 目前最主要的还是语音交互。用户可以直接与它对话。同时,它可以结合视觉能力,例如描述眼前看到的事物,并围绕视觉信息继续对话。我们也在尝试让它接入更复杂的能力,例如类似OpenClaw这样的系统,使其在对话中不仅能回答问题,还能生成内容,甚至触发具体动作(如执行某个指令)。因此,当前主要聚焦于桌面场景,尤其是在办公环境中进行交互。

问: 对于硬件制造商而言,什么样的具身智能演示是好的?如何定义一个好的任务?

吴丹: 在我看来,一个好的演示首先必须是稳定、实时、可互动的

互动体验与信任构建的核心

评判一个机器人演示是否成功,关键在于其互动是否流畅、运行是否稳定可靠。稳定性意味着机器人不仅能完成一次动作,更能持续、可复现地执行任务。

更重要的是,一个优秀的演示不应止步于炫技或展示硬件性能,而应成为开发者能够在其基础上继续延伸和创新的起点

我们认为,衡量机器人的标准不应仅仅是完成极限或复杂动作。其交互的流畅性、环境感知与理解能力,以及视觉、语音与关节运动的协调响应能力,才是更重要的维度。

我们与Pollen Robotics探讨过类似观点。他们强调:真正有价值的不是“机器人翻了一个跟头”这个结果,而是人们是否理解它是“如何”翻起来的。

如果观众只看到一个炫酷的动作,却对背后的系统原理、控制方法乃至如何安全停止它一无所知,这种体验反而会制造距离感甚至不安全感。没有人愿意面对一个不可控、不可理解的机器。

因此,安全性与可控性至关重要。例如,在我们的机械臂设计中,会加入悬停或紧急停止功能,确保人类始终拥有最终控制权。这种设计本身就是一种信任构建。对于与人类共处的人形机器人而言,这种安全考量尤为关键。

这也解释了为什么Reachy Mini的组装过程如此重要。用户并非被动观看它完成可爱动作,而是亲手参与搭建,理解其机械结构和工作原理。当你知道背后发生了什么,再去看它执行任务时,感受会截然不同。

我们认为,一个好的演示只是一个起点。通过亲自动手组装机器人,用户不仅能见证其出色完成任务,更能深入理解其运行机制。这个从实践到反馈的过程,会自然建立起人与机器之间的信任,深化互动体验。这种参与感,远比单纯观看演示更有意义。

数据范式如何定义硬件

Q:当前有一种观点认为,具身智能的硬件已经成熟,主要瓶颈在于软件。您如何看待这种说法?

吴丹:从硬件制造商的角度看,我们一直在跟随算法的演进进行迭代。

对于机器人而言,硬件与算法都至关重要。但算法在前期需要大量的数据积累,因此目前广泛的遥操作实践,本质上是在为算法训练铺设道路。许多规模化的数据工厂正在建立,专注于数据采集。遥操作是算法训练阶段的一部分,而数据采集的质量和规模非常关键。

正因为数据如此重要,市场上也出现了专门为高效数据采集而设计的硬件。随着数据量的不断增长,模型也会变得更加稳健。

这就是我们作为制造商对模型的看法。对于硬件本身,我们不能仅关注性能和成本,还必须考虑其与数据需求及训练框架的适配性。

例如,我们最新推出的全开源六轴机械臂(Seeed reBot-DevArm)是电机版本,已经适配了Hugging Face的LeRobot框架。这使得它能更顺畅地融入标准化的数据采集和训练流程。

Hugging Face桌面机器人Reachy Mini销量破百万美元,中国公司矽递科技成幕后关键

这其实也是硬件标准化趋势的一部分。随着模型架构与数据格式逐渐趋于统一,硬件接口也会向这些标准靠拢。

此外,当前不仅是真实世界采集的数据重要,仿真数据也扮演着越来越关键的角色。例如英伟达的GR00T等基础模型,就融合了多种数据源:真实采集数据、仿真数据以及视频数据。多源数据的融合能让模型更具鲁棒性。

因此,在矽递科技,我们也会支持类似英伟达Isaac Sim这样的仿真生态系统。

目标是让开发者既能在真实环境中使用我们的设备进行数据采集,也能在仿真环境中进行大规模的训练与测试。

总而言之,我认为硬件制造商需要更加注重产品的开放性和接口设计,以及生态兼容性,确保硬件能够满足数据和模型发展的需求。

整体而言,数据与模型是密不可分、相互决定的。

Q:我还有一个困惑。许多研究指出,不同硬件采集的数据存在差异,还涉及跨本体迁移的挑战。您刚才提到硬件会越来越标准化,数据也更易共享。但另一方面,硬件形态本身又是多样化的。多样性与标准化如何同时实现?我对这个过程的理解有些模糊。

朱耀晖:数据的多样性,可以类比于数据集的采集过程。例如,当人为遥操作机械臂从A点搬运物体到B点时,不同操作者的行为习惯可能不同,这就产生了多样性。

就像网络上公开的一些数据集,来自不同形态的机械臂或机器人执行类似动作时,其运动路径或风格也可能不同,这就是多样性。

而标准化,则是指这些数据集被采集到本地后,其存储和交换的数据格式是统一的。

这意味着,我可以用我的算法直接训练你的数据集,而无需进行额外的格式转换层处理,这就是标准化。

以Hugging Face推出的LeRobot框架为例,他们正是将硬件接口、数据接口进行了标准化定义。

松灵机器人、OpenArm等开源硬件,只要其接口符合规范,就可以直接接入这个生态。

在数据集层面,Hugging Face也推出了统一规范的LeRobot数据集格式。开发者可以将自己的数据转换成此标准格式,随后就能直接在不同硬件上进行部署或训练,从而打通了硬件与软件层面的差异。这是标准化所做的一项重大贡献。

因此,多样性体现在数据轨迹和运动姿态的差异上,而标准化则确保了数据格式的统一,使得数据能够被直接使用,无需转换。

Q:在具身智能领域,专业化分工与全栈模式,哪种更有未来?基于数据范式出现的专门制作数据的公司,意味着什么?

吴丹:我个人认为,这两种形态都会并存。

全栈公司通常围绕其自身产品构建能力。例如,一家专注于医疗机器人的公司,它提供的是直接面向该行业的解决方案,必然需要对医疗场景有深入的理解和自成一体的解决方案。

但同时,我也认为一定会出现分工明确的产业流水线。例如,会有团队专门负责某些特定场景(如医疗、家庭服务)的数据采集。

需要指出的是,用于采集的数据和最终用于训练模型的数据,两者是有区别的。

例如,光轮智能这样的公司,就是专注于生成仿真数据的。

仿真数据的优势在于,在保证一定精度的前提下更容易大规模获取。因为并非所有团队都有条件使用实体硬件进行大规模的真实数据采集,后者非常耗时且人力成本高昂。

正如我之前提到的,像英伟达GR00T这类大型基础模型,通常会融合多种来源的数据:真实场景数据、仿真数据以及视频数据。不同数据类型的结合能产生更好的效果。

因此,我认为未来一定会出现这种模块化、流水线式的分工,比如专门从事数据生产的公司。这个环节本身就在加速整个具身智能产业的发展。

但对于全栈公司而言,关键要看其是否专注于某一个具体的落地场景。如果是深耕单一场景,例如只做医院或零售,它就需要对该场景有极其深入的理解,在这种情况下,全栈模式具有优势。

而在模块化、流水线层面,通过专业分工和数据标准化,可以实现整体开发效率的加速。

Q:是否可以这样理解:在模型训练端,需要不同的数据“配方”,包括仿真数据、真实数据、视频数据等;对应到产业层面,就会出现专门的数据工厂负责采集或生成这些数据,从而形成更明确的分工,加速行业发展。而对于一些需要强场景落地的公司,它们会更倾向于围绕特定场景构建自己的数据闭环体系?

吴丹:(是的)

Q:过去一年,具身智能领域融资和创业项目大量涌现。很多人将2025年称为“量产元年”。我们目前究竟处于怎样的发展阶段?今年预计会出现哪些关键进展?

吴丹:我认为行业仍然处于早期阶段,但相信在今年,我们会看到越来越多的参考设计出现。

您提到2025年是“量产元年”,这标志着行业正从概念探索期,进入发展方向逐步清晰的过渡阶段,不再仅仅停留在理论或演示层面。

因此,我相信会有越来越多的参考设计,依托于活跃的社区和行业协作而诞生。

社区和行业内将有更多公司开始认真推进产品化。但这个领域的技术和模式必然还会持续演变。所以,无论是我们作为制造商,还是作为硬件平台,都需要保持长期视角,接纳并支持早期开发者当前的状态。

我们刚才也讨论了模块化。模块化趋势正日益向标准化靠拢。我认为,当前正是构建产品化能力和模块化能力的关键时期。

这包括我们自身产品的开源设计,如机械臂、灵巧手、主控方案、感知模块选型等。同时,我们也需要持续加强成本优化、量产能力以及生态协作。

生态协作即我们刚才提到的,如何更高效地与各类模型框架结合,如何与机器人操作系统(如ROS)等生态融合。我认为,从社区、硬件到软件的多方面同步加速,最终是为了推动并加速整个行业的商业化进程。

Q:回到贵公司自身,你们在具身智能生态中扮演着怎样的角色?

吴丹:我认为我们在具身智能的开发者生态中,是一个具有独特价值的平台。

首先,从产品线来看,正如之前提到的,我们是从完整的机器人系统角度出发,为开发者提供产品。

在作为机器人“大脑”的主控计算平台层面,我们是英伟达的精英级合作伙伴。

同时,我们在英伟达开发者生态中也保持着活跃的参与,通过提供丰富的课程、教程以及便捷的一键部署能力,服务于开发者社区。总体而言,我们致力于构建一个新兴、技术先进且对开发者友好的平台。

在机器人领域,我们持续引入了新的内容与工具。例如,面向具身智能开发的LeRobot开源框架,在GitHub上已获得超过两万星标,在早期开发者中具有广泛的影响力。

围绕这一生态,我们推出了配套的硬件套件、详细教程及相关产品,以帮助开发者加速上手进程。

因此,对于希望早期进入具身智能领域的开发者,矽递科技能够提供一个相对完整的产品体系与教程支持。

我们并不以“市场占有率”或“单一产品最优”来定义自身。作为一家开源硬件公司,在AI机器人产品线上,我们的核心目标是降低具身智能的开发门槛。

在这一方向上,我们认为取得了不错的进展。我们在开发者生态中保持活跃,并持续提供新颖、有趣且可实践的开发内容。

Q:最后一个问题,什么是开源硬件?

吴丹:简而言之,开源硬件是指用户能够基于开放的硬件设计与软件层进行学习与二次开发。

在矽递科技,我们的使命是让科技触手可及。我们专注于为全球创客、开发者及科研人员提供边缘AI、机器人及智能传感器系统等前沿技术,赋能每一位创新者实现数字化转型。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/27842

(0)
上一篇 2天前
下一篇 2天前

相关推荐

  • 量子科技产业链全景解析:2026年全球竞争格局与产业机遇

    量子科技产业链全景解析:2026年全球竞争格局与产业机遇(第1/4部分) 核心要点 全球高度重视量子科技,国际竞争激烈 量子科技已成为全球主要国家在科技、经济等领域开展综合国力竞争、维护国家技术主权与发展主动权的战略重点之一,对国防安全、信息安全等关键领域具有深远影响。截至2025年8月,全球已有30余个国家和地区制定或更新了量子信息领域的发展战略规划或法案…

    2026年3月3日
    60400
  • 摩尔线程科创板上市:国产GPU的里程碑与AI智算战略转型深度解析

    2024年11月28日,中国半导体产业迎来标志性事件——摩尔线程正式登陆科创板,成为“国产通用GPU第一股”。这不仅是一次资本市场的成功,更是中国在高性能计算芯片领域自主创新战略的重要突破。开盘价650元,较发行价114.28元暴涨469%,市值突破3055亿元,这一系列数字背后,折射出市场对国产GPU技术路径与商业前景的强烈信心。 从技术演进视角分析,摩尔…

    2025年12月5日
    26100
  • 从通用炫技到垂直深耕:斑马口语如何以AI Agent技术重塑英语教育新范式

    2025年,AI产业的焦点正从实验室的惊艳演示转向商业价值的深度挖掘。当OpenAI、Google等巨头仍在探索多模态大模型的通用可能性时,一场决定AI真正落地效能的战役已在教育、医疗、客服等垂直领域悄然打响。在这场产业化竞赛中,斑马推出的业内首个实现AI外教一对一教学的「斑马口语」产品,不仅标志着AI Agent在垂直行业的实质性突破,更以系统性的技术攻坚…

    2025年11月18日
    20700
  • 光轮智能完成10亿元融资,成为全球首个具身数据独角兽,构建物理AI新基础设施

    AI 正从数字世界走向物理世界。 近日,光轮智能完成 10 亿元 A++ 及 A+++ 轮融资。本轮融资引入多家产业场景方及财务机构,包括新希望集团、鼎邦投资(三安光电董事长家族办公室)、奥克斯、鼎石资管等产业投资方,以及建投华科、国方创新、道禾长期投资、清新资本等财务投资机构。 本轮融资完成后,光轮智能成为全球首个具身数据领域的独角兽企业。资金将重点投入于…

    2026年3月12日
    23600
  • AI重构游戏开发范式:从引擎集成到全生命周期赋能的技术演进

    在上海举办的2025 Unity开发者大会上,”AI+游戏”的融合趋势得到了系统性展示,标志着游戏产业正经历从辅助工具到核心引擎的技术范式转移。这一变革不仅体现在开发效率的量化提升,更深入到创意生成、资产制作、运维管理等全链条环节,预示着游戏行业将迎来新一轮生产力革命。 从技术演进路径看,AI在游戏领域的应用已从早期的概念验证阶段,进…

    2025年11月1日
    24500