这是一场前所未有的发布会。
直播画面中,超维动力(Kinetix AI)的联合创始人 Tyler Zheng 率先亮相,但他并没有说太多话,很快就话锋一转:“我们相信,如果机器人已经足够拟人化,也许它自己就能介绍自己。” 随即,他将舞台交给了今天的主角——KAI。
在接下来的 20 多分钟里,画面中没有出现任何人类工程师或高管,只有两台 KAI 人形机器人。
它们以对话的形式完成了“自己发布自己”的壮举,过程中涉及了大量技术内容:超拟人本体、世界模型、数据体系、训练方法…… 其中一台机器人在发布会中途还打趣地表示,自己更想回到“第二现场”继续叠衣服。
抛开表演成分不谈,超维动力通过这场别开生面的发布会展示了一个观点:如果一台机器人能够独立主持一场技术发布会,那么“高拟人”与“高智能”同时实现,或许不再只是一句口号。
超维动力于 2025 年 7 月注册,9 月正式启动研发,成立至今尚不足一年。在此之前,他们已经发布了 全球首个可户外自主感知的高动态人形机器人乒乓球系统 SMASH 和 双臂机器人服装操作框架 χ₀ 等成果,而这次发布会则是他们首次大规模公开亮相。
机器人为什么一定要长得像人?
在人形机器人这条赛道上,关于“为什么要做人形”这个问题,不同公司给出了截然不同的答案。
特斯拉 Optimus 的逻辑是效率优先:先进入工厂,先跑起来,拟人程度是次要的。另一些公司则走工具路线,采用机械臂加轮子的组合,只要能完成任务即可。甚至有观点认为,人形根本就不是未来。MIT 机器人学家、iRobot 联合创始人 Rodney Brooks 曾多次公开表示,未来 15 年内真正落地的“人形机器人”将装上轮子、配备多条机械臂,彻底抛弃人类的外形。
超维动力则给出了另一套解释框架。
KAI 在发布会上用第一人称说了这样一段话:“这个世界是由人类创造的,因此也是为人类设计的。楼梯、门把手、桌子、厨房、椅子,所有的东西都是按照人类的习惯去打造的。所以只有一个超拟人的我,才能真正快速进入你们的生活。”

这不只是产品层面的判断,背后还隐藏着一条数据层面的逻辑链。
人形本体与人类运动高度相似,意味着人类产生的海量数据都可以相对直接地用来训练机器人,例如动作捕捉库、医疗康复数据、日常生活的第一视角影像。
正在人形机器人领域创业的前 MIT CSAIL 研究员 Sandor Felber 曾撰文指出,人形机器人的关节构型与人体高度一致,这使得模仿学习变得更加自然和高效。“当机器人的运动学与人类高度匹配时,从人类示范中收集训练数据也会更加直接。”
也就是说,不仅进入人类世界需要人的形状,学习人类技能也需要人的形状。这正是超维动力联合创始人 Tyler 所强调的:“如果要承载更强的 World Model(世界模型),机器人就需要一个更高拟人的本体,因为人类世界本身就是围绕人的身体所构建的。”
高拟人是训练更强世界模型的前提条件。形体是数据兼容性的保证,也是进入人类生活最低成本的可行路径。这个判断是否成立,是超维动力整条技术路线的基石。
那么,在“人形是正确的起点”这个判断之上,超维动力究竟构建了一套什么样的技术体系?先从最直观的部分说起——KAI 的本体。
KAI 确实很像人!
KAI 在发布会上说了这样一段话:“屏幕前的各位今天在看到我的那一瞬间,甚至是现在,都会觉得我是一个真人,穿着服装在假装机器人。如果你真的这么想,我觉得这就是对我在超高拟人形态上的最大肯定了。”

这当然有几分自夸的成分,但这句话背后是一套严肃的工程逻辑。
超维动力在硬件设计上坚持从第一性原理出发:不是先做一台机器人,再考虑它像不像人,而是先研究人类运动学,再逆向推导关节的设计。

工程师为此研究了生物工程学和解剖学,“逆向了人类的肌肉应力关节的力学支撑系统”。这个设计哲学从体型比例一直贯穿到触觉皮肤,涵盖了体型、体格、体能与感官四个维度。
KAI 在发布会上表示:“对人类的完美复刻让我几乎能覆盖人类所有的运动空间。”
体型:人类社会的“通行证”
KAI 身高 173cm,体重 70kg,头身比 1:8.5——这样的 9.5 头身身材甚至优于大多数人类模特的比例。

这些数字是审美选择,更是工程约束:只有尺度与人类高度吻合,KAI 的动作轨迹才能精准对齐人类数据,才能无缝兼容为人类尺度设计的空间和工具。

比例失调的机器会让人本能产生警觉和防备,甚至引发所谓的“恐怖谷效应”,而这正是机器人进入人类场景最大的障碍之一。KAI 的体态设计,是让它在进入人类生活空间时不带来压迫感的前提,就像是一张自带的“通行证”。
体格:115 个自由度,极限复刻人类运动空间
KAI 拥有 115 个全身自由度,是目前公开信息中全球人形机器人自由度最高的。
自由度分布上,除了四肢关节,肩部、颈部、腰部均有独立自由度。正是这些在其他机器人中往往被简化掉的冗余自由度,让 KAI 在贴身操作时能灵活调整躯干姿态,覆盖人类几乎所有的运动空间。KAI 在发布会上自述“甚至能完成一些高难度的瑜伽动作”。

和人类一样,KAI 也有一双灵巧手,其共有 36 个自由度,其中 22 个主动自由度负责精细操作,14 个柔顺自由度负责安全接触。超维动力称:“这都是一双像人类双手的灵巧手”。

顺带一提,柔顺自由度的作用是:当手背碰到桌角这类硬物时,不会造成刚性接触损伤,而是通过柔顺结构将冲击化解。正如 KAI 所说,“唯一值得欣慰的是,我不会像人类一样感到疼痛”。
此外,KAI 的灵巧手还采用了单向自锁结构,让其在长时间握持重物时不需要持续高能耗维持,结构本身就能“锁住”。这更贴近日常长时作业场景的需求,但离大规模进入日常生活仍取决于整机稳定性、成本和场景适配能力。
体能:为真实工作场景设计的动力系统
高拟人本体的一大隐患是能耗与散热。为此,超维动力在执行器设计上做了系统性收敛:工程师大量分析人体运动规律,将全身执行器精简至 6 个 SKU,找到高拟人与稳定性之间的平衡点。
动力方面,KAI 搭载定制半固态电池,正常工作续航超过 3 小时,慢跑可续航 2 小时,且不会过热。KAI 对此颇为自信:“这样看来明年的半马比赛我应该也可以参加了,如果我的工程师允许的话。”

另外,KAI 还搭载了定制化的柔顺执行器,其能在提升整体柔顺度的同时,支撑起双臂 20 公斤的负载能力,足以胜任大多数家庭和商业场景中的搬运与操作任务。
感官:触觉决定拥抱时的力度
体格和体能之外,超维动力认为一个真正拟人的本体还必须拥有更丰富的感官——“能充分感知周围,甚至是看不到的地方”。为此,工程师专门为 KAI 定制了一套全身触觉皮肤系统。
这套全身触觉皮肤覆盖了 KAI 80% 的体表,共 18,000 个触点,能感知低至 0.1N 的微弱触碰。这种感知精度让 KAI 在与人接触时可以主动控制力度,而不只是被动承受。
KAI 在发布会上说道:“视觉决定了我们能离多近,而触觉决定了我们拥抱时的力度。触觉让我不仅能看见你,还能感受你,我觉得这才是我能和你们人类真正共处的基础。”

对于人机共融而言,触觉的价值或许超越了运动本身。它是机器人进入人类亲密空间的前提,也是让人感到安全而非防备的关键。
最后,和人类一样,KAI 也支持换装以适应不同的工作场景。

KAI 的脑与经验:世界模型、数据与训练
拥有一副高度拟人的身体后,下一个问题是:如何驾驭它?这取决于 KAI 的智能系统。具体来说,超维动力构建了一套基于世界模型、数据体系与训练方法的闭环。
KAI 的大小脑:三模型架构
超维动力对“机器人智能”有自己的定义:在他们看来,一个真正可用的具身智能系统,不应只是进行局部的机械执行。
KAI 的世界模型正是这套逻辑的实现。三个模型形成闭环:世界模型在机器人行动之前预测“如果我这样做,世界会变成什么样”;动作模型在此基础上生成候选动作;评估模型则从任务目标接近度、接触安全性、本体可行域三个维度逐一打分,选出最优方案再执行。

对于这种“先演练再执行”的决策逻辑,KAI 在发布会上用了一个贴切的类比:“我现在假如要写字,结果好坏一定是建立在我脑海中数百万次预演结果的储备上。”看起来,这套逻辑和人类面对复杂任务时的思考方式是一致的。
KAI 的数据:10 万小时第一视角数据
世界模型的能力上限,最终取决于数据。超维动力选择从第一视角数据切入,就像人眼视角一样。这个选择背后有一个清晰的判断:人类本身就是成本最低的数据生产者,而第一人称视角数据来源于人类日常生活,天然可以解决数据的规模化瓶颈。
为此,他们自研了一套轻量化头环:KAI Halo。

这个设备以头环形态佩戴,不遮挡视野,可以用纯视觉方式完成人体姿态重建、场景点云重建,以及包含语义标注的数据采集,一站式完成所有数据化收集工作。
数据采集以众包方式进行。超维动力将设备分发到家庭、酒店等 20 多个场景,采集过程没有任何脚本编排——使用者只需戴上设备,正常生活和工作即可。

目前,超维动力已累积 10 万小时第一视角数据。
为了处理这么多数据,超维动力搭建了一套自动化的 Infra 平台,负责全链路的数据处理:首先检测采集过程中的异常片段(如关节数据丢失、运动轨迹异常),过滤掉可能污染模型的数据;然后把通过质检的数据通过运动重定向,映射到机器人本体的运动空间约束上;最后根据训练目标按场景调配数据比例,自动生成数据集,送入模型训练。

KAI 的学习:从通用常识到本体对齐的三段式训练
数据齐备之后,该如何训练呢?超维动力采用了一种三段式训练策略,三个阶段分别解决不同的问题。
第一阶段是预训练。使用大量互联网开源数据、仿真环境数据,以及自采数据补充全身与环境交互的语义信息,目的是给模型建立起对物理世界的通用常识和泛化能力。这是世界模型和价值评估模型的基础。

第二阶段是桥接训练。预训练阶段有一个固有缺陷:模型见过的数据大多没有物理接触的细节。桥接训练专门补足这一缺口,重点使用两类自研数据:UMI 数据解决不同抓握方式的接触力差异,数采手套数据补足手指关节弯曲与摩擦力细节。

第三阶段是后训练。引入真机遥操作数据,把此前训练好的模型与 KAI 的实体硬件完成最终对齐。

本体、大脑、数据、训练,四块拼图在这场 KAI 自己主持的发布会上同时亮相。对超维动力来说,这四者本就是一个不可分割的整体。
KAI 之后……
“Machine Intelligence. Has a Body.”智力不应仅仅是悬浮在云端的代码,它也需要一具躯体来确认自身的重量。
衡量人形机器人是否真正可用,关键在于它能否在开放场景下自主应对不确定性。超维动力正在用 KAI 证明:感知精度、关节自由度与触觉反馈这些物理世界的硬约束并没有成为拖累,反而成为了 AGI 真正落地的优选路径之一。
KAI 将机器人本体重新拉回了智能的方程式之中:世界模型需要高拟人本体去执行动作,高拟人本体反过来又为世界模型提供了优质的训练载体。两者互相驱动,形成了一个正向运转的飞轮。
不过,站在行业的客观视角审视,这依然是一场极具冒险精神的技术押注。硬件的复杂性与软件的快速迭代逻辑天然存在着巨大的时间差。115 个自由度、复杂的灵巧手以及极致的拟人设计,意味着呈指数级上升的工程难度与制造成本。
超维动力构想的数据飞轮在理论上高度自洽,但从可控的发布会舞台走向充满无尽长尾场景的真实世界,中间依然横亘着一道巨大的鸿沟。这不仅考验着团队极其坚韧的工程落地能力,也需要市场和资本给予足够的耐心。
在发布会结束前,KAI 说了这样一段话:“从今天开始,我不再只是实验室里的一个概念,我已经以 KAI 的名字真正站到你们面前。我仍在学习,我仍在进化。”
“机器人能否真正进入人类生活”这个行业难题,如今终于有了一个可以被看见、被追问、被检验的具体形态。
正如超维动力 Slogan 所表达的:“What starts here, Changes the life.”今天开始的一切,终将改变生活。这条通往人机共存未来的路注定充满挑战,但总得有人先走。
关注“鲸栖”小程序,掌握最新AI资讯
本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/32423

