人形机器人自己开了一场发布会，全程无人类参与，高拟人+高智能能否成为现实？

1小时前 • AI产业动态 • 阅读 17

这是一场前所未有的发布会。

直播画面中，超维动力（Kinetix AI）的联合创始人 Tyler Zheng 率先亮相，但他并没有说太多话，很快就话锋一转：“我们相信，如果机器人已经足够拟人化，也许它自己就能介绍自己。” 随即，他将舞台交给了今天的主角——KAI。

在接下来的 20 多分钟里，画面中没有出现任何人类工程师或高管，只有两台 KAI 人形机器人。

它们以对话的形式完成了“自己发布自己”的壮举，过程中涉及了大量技术内容：超拟人本体、世界模型、数据体系、训练方法…… 其中一台机器人在发布会中途还打趣地表示，自己更想回到“第二现场”继续叠衣服。

抛开表演成分不谈，超维动力通过这场别开生面的发布会展示了一个观点：如果一台机器人能够独立主持一场技术发布会，那么“高拟人”与“高智能”同时实现，或许不再只是一句口号。

超维动力于 2025 年 7 月注册，9 月正式启动研发，成立至今尚不足一年。在此之前，他们已经发布了全球首个可户外自主感知的高动态人形机器人乒乓球系统 SMASH 和双臂机器人服装操作框架 χ₀ 等成果，而这次发布会则是他们首次大规模公开亮相。

机器人为什么一定要长得像人？

在人形机器人这条赛道上，关于“为什么要做人形”这个问题，不同公司给出了截然不同的答案。

特斯拉 Optimus 的逻辑是效率优先：先进入工厂，先跑起来，拟人程度是次要的。另一些公司则走工具路线，采用机械臂加轮子的组合，只要能完成任务即可。甚至有观点认为，人形根本就不是未来。MIT 机器人学家、iRobot 联合创始人 Rodney Brooks 曾多次公开表示，未来 15 年内真正落地的“人形机器人”将装上轮子、配备多条机械臂，彻底抛弃人类的外形。

超维动力则给出了另一套解释框架。

KAI 在发布会上用第一人称说了这样一段话：“这个世界是由人类创造的，因此也是为人类设计的。楼梯、门把手、桌子、厨房、椅子，所有的东西都是按照人类的习惯去打造的。所以只有一个超拟人的我，才能真正快速进入你们的生活。”

人形机器人自己开了一场发布会，全程无人类参与，高拟人+高智能能否成为现实？

这不只是产品层面的判断，背后还隐藏着一条数据层面的逻辑链。

人形本体与人类运动高度相似，意味着人类产生的海量数据都可以相对直接地用来训练机器人，例如动作捕捉库、医疗康复数据、日常生活的第一视角影像。

正在人形机器人领域创业的前 MIT CSAIL 研究员 Sandor Felber 曾撰文指出，人形机器人的关节构型与人体高度一致，这使得模仿学习变得更加自然和高效。“当机器人的运动学与人类高度匹配时，从人类示范中收集训练数据也会更加直接。”

也就是说，不仅进入人类世界需要人的形状，学习人类技能也需要人的形状。这正是超维动力联合创始人 Tyler 所强调的：“如果要承载更强的 World Model（世界模型），机器人就需要一个更高拟人的本体，因为人类世界本身就是围绕人的身体所构建的。”

高拟人是训练更强世界模型的前提条件。形体是数据兼容性的保证，也是进入人类生活最低成本的可行路径。这个判断是否成立，是超维动力整条技术路线的基石。

那么，在“人形是正确的起点”这个判断之上，超维动力究竟构建了一套什么样的技术体系？先从最直观的部分说起——KAI 的本体。

KAI 确实很像人！

KAI 在发布会上说了这样一段话：“屏幕前的各位今天在看到我的那一瞬间，甚至是现在，都会觉得我是一个真人，穿着服装在假装机器人。如果你真的这么想，我觉得这就是对我在超高拟人形态上的最大肯定了。”

人形机器人自己开了一场发布会，全程无人类参与，高拟人+高智能能否成为现实？

这当然有几分自夸的成分，但这句话背后是一套严肃的工程逻辑。

超维动力在硬件设计上坚持从第一性原理出发：不是先做一台机器人，再考虑它像不像人，而是先研究人类运动学，再逆向推导关节的设计。

人形机器人自己开了一场发布会，全程无人类参与，高拟人+高智能能否成为现实？

工程师为此研究了生物工程学和解剖学，“逆向了人类的肌肉应力关节的力学支撑系统”。这个设计哲学从体型比例一直贯穿到触觉皮肤，涵盖了体型、体格、体能与感官四个维度。

KAI 在发布会上表示：“对人类的完美复刻让我几乎能覆盖人类所有的运动空间。”

体型：人类社会的“通行证”

KAI 身高 173cm，体重 70kg，头身比 1:8.5——这样的 9.5 头身身材甚至优于大多数人类模特的比例。

人形机器人自己开了一场发布会，全程无人类参与，高拟人+高智能能否成为现实？

这些数字是审美选择，更是工程约束：只有尺度与人类高度吻合，KAI 的动作轨迹才能精准对齐人类数据，才能无缝兼容为人类尺度设计的空间和工具。

人形机器人自己开了一场发布会，全程无人类参与，高拟人+高智能能否成为现实？

比例失调的机器会让人本能产生警觉和防备，甚至引发所谓的“恐怖谷效应”，而这正是机器人进入人类场景最大的障碍之一。KAI 的体态设计，是让它在进入人类生活空间时不带来压迫感的前提，就像是一张自带的“通行证”。

体格：115 个自由度，极限复刻人类运动空间

KAI 拥有 115 个全身自由度，是目前公开信息中全球人形机器人自由度最高的。

自由度分布上，除了四肢关节，肩部、颈部、腰部均有独立自由度。正是这些在其他机器人中往往被简化掉的冗余自由度，让 KAI 在贴身操作时能灵活调整躯干姿态，覆盖人类几乎所有的运动空间。KAI 在发布会上自述“甚至能完成一些高难度的瑜伽动作”。

人形机器人自己开了一场发布会，全程无人类参与，高拟人+高智能能否成为现实？

和人类一样，KAI 也有一双灵巧手，其共有 36 个自由度，其中 22 个主动自由度负责精细操作，14 个柔顺自由度负责安全接触。超维动力称：“这都是一双像人类双手的灵巧手”。

人形机器人自己开了一场发布会，全程无人类参与，高拟人+高智能能否成为现实？

顺带一提，柔顺自由度的作用是：当手背碰到桌角这类硬物时，不会造成刚性接触损伤，而是通过柔顺结构将冲击化解。正如 KAI 所说，“唯一值得欣慰的是，我不会像人类一样感到疼痛”。

此外，KAI 的灵巧手还采用了单向自锁结构，让其在长时间握持重物时不需要持续高能耗维持，结构本身就能“锁住”。这更贴近日常长时作业场景的需求，但离大规模进入日常生活仍取决于整机稳定性、成本和场景适配能力。

体能：为真实工作场景设计的动力系统

高拟人本体的一大隐患是能耗与散热。为此，超维动力在执行器设计上做了系统性收敛：工程师大量分析人体运动规律，将全身执行器精简至 6 个 SKU，找到高拟人与稳定性之间的平衡点。

动力方面，KAI 搭载定制半固态电池，正常工作续航超过 3 小时，慢跑可续航 2 小时，且不会过热。KAI 对此颇为自信：“这样看来明年的半马比赛我应该也可以参加了，如果我的工程师允许的话。”

人形机器人自己开了一场发布会，全程无人类参与，高拟人+高智能能否成为现实？

另外，KAI 还搭载了定制化的柔顺执行器，其能在提升整体柔顺度的同时，支撑起双臂 20 公斤的负载能力，足以胜任大多数家庭和商业场景中的搬运与操作任务。

感官：触觉决定拥抱时的力度

体格和体能之外，超维动力认为一个真正拟人的本体还必须拥有更丰富的感官——“能充分感知周围，甚至是看不到的地方”。为此，工程师专门为 KAI 定制了一套全身触觉皮肤系统。

这套全身触觉皮肤覆盖了 KAI 80% 的体表，共 18,000 个触点，能感知低至 0.1N 的微弱触碰。这种感知精度让 KAI 在与人接触时可以主动控制力度，而不只是被动承受。

KAI 在发布会上说道：“视觉决定了我们能离多近，而触觉决定了我们拥抱时的力度。触觉让我不仅能看见你，还能感受你，我觉得这才是我能和你们人类真正共处的基础。”

人形机器人自己开了一场发布会，全程无人类参与，高拟人+高智能能否成为现实？

对于人机共融而言，触觉的价值或许超越了运动本身。它是机器人进入人类亲密空间的前提，也是让人感到安全而非防备的关键。

最后，和人类一样，KAI 也支持换装以适应不同的工作场景。

人形机器人自己开了一场发布会，全程无人类参与，高拟人+高智能能否成为现实？

KAI 的脑与经验：世界模型、数据与训练

拥有一副高度拟人的身体后，下一个问题是：如何驾驭它？这取决于 KAI 的智能系统。具体来说，超维动力构建了一套基于世界模型、数据体系与训练方法的闭环。

KAI 的大小脑：三模型架构

超维动力对“机器人智能”有自己的定义：在他们看来，一个真正可用的具身智能系统，不应只是进行局部的机械执行。

KAI 的世界模型正是这套逻辑的实现。三个模型形成闭环：世界模型在机器人行动之前预测“如果我这样做，世界会变成什么样”；动作模型在此基础上生成候选动作；评估模型则从任务目标接近度、接触安全性、本体可行域三个维度逐一打分，选出最优方案再执行。

人形机器人自己开了一场发布会，全程无人类参与，高拟人+高智能能否成为现实？

对于这种“先演练再执行”的决策逻辑，KAI 在发布会上用了一个贴切的类比：“我现在假如要写字，结果好坏一定是建立在我脑海中数百万次预演结果的储备上。”看起来，这套逻辑和人类面对复杂任务时的思考方式是一致的。

KAI 的数据：10 万小时第一视角数据

世界模型的能力上限，最终取决于数据。超维动力选择从第一视角数据切入，就像人眼视角一样。这个选择背后有一个清晰的判断：人类本身就是成本最低的数据生产者，而第一人称视角数据来源于人类日常生活，天然可以解决数据的规模化瓶颈。

为此，他们自研了一套轻量化头环：KAI Halo。

人形机器人自己开了一场发布会，全程无人类参与，高拟人+高智能能否成为现实？

这个设备以头环形态佩戴，不遮挡视野，可以用纯视觉方式完成人体姿态重建、场景点云重建，以及包含语义标注的数据采集，一站式完成所有数据化收集工作。

数据采集以众包方式进行。超维动力将设备分发到家庭、酒店等 20 多个场景，采集过程没有任何脚本编排——使用者只需戴上设备，正常生活和工作即可。

人形机器人自己开了一场发布会，全程无人类参与，高拟人+高智能能否成为现实？

目前，超维动力已累积 10 万小时第一视角数据。

为了处理这么多数据，超维动力搭建了一套自动化的 Infra 平台，负责全链路的数据处理：首先检测采集过程中的异常片段（如关节数据丢失、运动轨迹异常），过滤掉可能污染模型的数据；然后把通过质检的数据通过运动重定向，映射到机器人本体的运动空间约束上；最后根据训练目标按场景调配数据比例，自动生成数据集，送入模型训练。

人形机器人自己开了一场发布会，全程无人类参与，高拟人+高智能能否成为现实？

KAI 的学习：从通用常识到本体对齐的三段式训练

数据齐备之后，该如何训练呢？超维动力采用了一种三段式训练策略，三个阶段分别解决不同的问题。

第一阶段是预训练。使用大量互联网开源数据、仿真环境数据，以及自采数据补充全身与环境交互的语义信息，目的是给模型建立起对物理世界的通用常识和泛化能力。这是世界模型和价值评估模型的基础。

人形机器人自己开了一场发布会，全程无人类参与，高拟人+高智能能否成为现实？

第二阶段是桥接训练。预训练阶段有一个固有缺陷：模型见过的数据大多没有物理接触的细节。桥接训练专门补足这一缺口，重点使用两类自研数据：UMI 数据解决不同抓握方式的接触力差异，数采手套数据补足手指关节弯曲与摩擦力细节。

人形机器人自己开了一场发布会，全程无人类参与，高拟人+高智能能否成为现实？

第三阶段是后训练。引入真机遥操作数据，把此前训练好的模型与 KAI 的实体硬件完成最终对齐。

人形机器人自己开了一场发布会，全程无人类参与，高拟人+高智能能否成为现实？

本体、大脑、数据、训练，四块拼图在这场 KAI 自己主持的发布会上同时亮相。对超维动力来说，这四者本就是一个不可分割的整体。

KAI 之后……

“Machine Intelligence. Has a Body.”智力不应仅仅是悬浮在云端的代码，它也需要一具躯体来确认自身的重量。

衡量人形机器人是否真正可用，关键在于它能否在开放场景下自主应对不确定性。超维动力正在用 KAI 证明：感知精度、关节自由度与触觉反馈这些物理世界的硬约束并没有成为拖累，反而成为了 AGI 真正落地的优选路径之一。

KAI 将机器人本体重新拉回了智能的方程式之中：世界模型需要高拟人本体去执行动作，高拟人本体反过来又为世界模型提供了优质的训练载体。两者互相驱动，形成了一个正向运转的飞轮。

不过，站在行业的客观视角审视，这依然是一场极具冒险精神的技术押注。硬件的复杂性与软件的快速迭代逻辑天然存在着巨大的时间差。115 个自由度、复杂的灵巧手以及极致的拟人设计，意味着呈指数级上升的工程难度与制造成本。

超维动力构想的数据飞轮在理论上高度自洽，但从可控的发布会舞台走向充满无尽长尾场景的真实世界，中间依然横亘着一道巨大的鸿沟。这不仅考验着团队极其坚韧的工程落地能力，也需要市场和资本给予足够的耐心。

在发布会结束前，KAI 说了这样一段话：“从今天开始，我不再只是实验室里的一个概念，我已经以 KAI 的名字真正站到你们面前。我仍在学习，我仍在进化。”

“机器人能否真正进入人类生活”这个行业难题，如今终于有了一个可以被看见、被追问、被检验的具体形态。

正如超维动力 Slogan 所表达的：“What starts here, Changes the life.”今天开始的一切，终将改变生活。这条通往人机共存未来的路注定充满挑战，但总得有人先走。

关注“鲸栖”小程序，掌握最新AI资讯

本文来自网络搜集，不代表鲸林向海立场，如有侵权，联系删除。转载请注明出处：https://www.itsolotime.com/archives/32423

KAI 世界模型人形机器人超维动力高拟人

赞 (0)

0 0

仅9B参数实现全双工全模态！MiniCPM-o 4.5让端侧AI普惠，12GB显存即可运行

上一篇 1小时前

商汤开源8B模型复刻GPT-Image-2绝活：图文生成连续一致，高密度信息图直接出

下一篇 1小时前

AI产业动态

Dato：突破内存墙，数据流加速器编程新范式实现98%理论峰值利用率

关键词：Dato、数据流加速器、任务型编程模型、通信抽象、虚拟-物理映射随着人工智能计算的不断发展，数据流加速器将扮演越来越重要的角色。Dato为这些复杂硬件的编程提供了全新的思路，有望成为下一代人工智能计算基础设施的关键组成部分。 Dato的核心创新在于其类型系统的设计，将数据通信和数据分片都提升为一等类型，这使得编译器能够在早期阶段进行深入的分析和优化…

2026年1月17日
405000
AI产业动态

从5美元切片到虚拟免疫图谱：GigaTIME如何用AI重构癌症研究的尺度与边界

在癌症免疫研究领域，成本与样本量长期构成难以逾越的双重壁垒。传统multiplex immunofluorescence（mIF）技术虽能提供高维免疫信息，但每张切片动辄数千美元的成本、漫长的处理周期以及有限的样本覆盖，使其始终困于“昂贵稀缺”的困境。医院日常产生的H&E染色切片虽单价仅5-10美元，却长期被视作基础诊断工具，其与高维免疫图谱的潜在关…

2025年12月13日
376000
AI产业动态

视觉压缩革命：DeepSeek-OCR如何颠覆AI信息处理范式

在人工智能领域，信息表示与处理效率一直是核心挑战。DeepSeek-OCR的开源发布，不仅是一个技术工具的更新，更可能标志着AI架构范式的根本性转变。这项技术提出的“上下文光学压缩”概念，正在重新定义我们对多模态AI的理解边界。从技术原理层面分析，DeepSeek-OCR的核心突破在于证明了视觉表示在信息压缩上的显著优势。在长上下文解码任务中，该模型在保持…

2025年11月14日
322000
AI产业动态

迈向AGI新范式：视频空间超感知如何突破LLM感知瓶颈

在人工智能迈向通用智能（AGI）的漫长征程中，一个根本性的哲学问题日益凸显：在构建超级智能之前，我们首先需要什么？近期，由Yann LeCun、李飞飞和谢赛宁三位顶尖学者联合发表的论文《Cambrian-S：迈向视频中的空间超感知》为这个问题提供了极具启发性的答案。这篇论文不仅标志着多模态研究的重要转向，更可能重新定义AI感知能力的演进路径。三位作者的组合…

2025年11月10日
228000
AI产业动态

从AI先驱到华尔街巨鳄：Hinton首位博士生的跨界传奇

一张照片，一段往事最近，一张老照片在AI圈内重新引发了热议。这张照片是1986年CMU首届联结主义夏令营的合影。有人将这张合影誉为AI界的“索尔维会议”。对于研究神经网络、计算神经科学和计算语言学的后辈而言，几乎都能在这张照片里找到自己领域的开创者。照片中被圈出的，是深度学习的奠基人、图灵奖得主Geoffrey Hinton。正是在他的坚持下，神经网…

2026年1月10日
457000