RoboPocket：让普通人成为具身智能数据采集师，边采边筛提升模型训练效率

一部手机加一个“夹爪”，随时随地采集具身智能数据

现在，只需一部手机和一个“夹爪”，就能随时随地完成具身智能数据采集。

采集到的数据质量高、可直接用于训练，并已在模型训练中验证了效果。
* 模型在多步连续任务中，动作衔接更稳定。
* 在真实场景中面对光照变化、环境杂乱或物体遮挡时，执行鲁棒性显著提升，更不容易失手。
* 当任务目标发生小幅变化（如操作顺序调整）时，模型也更容易举一反三，做出合理应对。

这套采集系统为模型训练带来了切实的增益。

这套可搭载手机的便携式数据采集终端及其配套应用程序，名为RoboPocket，由具身智能公司穹彻智能推出。

它是新兴采集设备UMI（通用操作接口）的进阶形态。与传统UMI方案相比，RoboPocket在保持便携易用的基础上更加轻盈：手机与夹爪即构成一个采集节点。这意味着任何人——即使是普通用户——都可以从口袋中掏出RoboPocket，随时随地进行具身数据采集。

但这还不是它最核心的亮点。

最巧妙之处在于，RoboPocket将模型训练的需求前置到了采集一线，让采集行为能实时接入模型的训练闭环。 在采集过程中，系统会同步评估每一段数据的训练价值，并即时给出反馈与引导，使采集行为本身朝着模型真正需要的方向收敛。每一次采集都直接服务于模型进化，极大减少了数据浪费。

系统在数据生成的过程中，就完成了价值筛选。最终交付给模型的数据从源头就更加清晰、准确，对模型训练也更有用。

具身模型想规模化，数据瓶颈在哪？

在具身智能领域，数据的重要性已是共识。模型需要大量高质量、多样性的具身数据进行训练。

自2023年起，许多团队投入资源建设数据采集工厂，希望通过规模化生产支撑模型训练。但实践很快暴露出一个问题：数据流水线建成了，数据量上来了，模型能力却未能持续稳定提升。

原因并不复杂。数据采集厂依赖预设场景和标准化流程，这在工业数据领域有效，却难以覆盖真实世界中大量非标准、非重复的操作情境。采集的动作容易模式化，任务分布集中，环境变化有限，导致数据同质化严重，训练收益很快出现边际递减。

有从业人员指出，当前具身数据量日益增长，训练效率却可能出现不升反降的情况。

而具身模型真正需要的，恰恰是发生在真实环境中、不那么规整的操作过程。这正是UMI设备出现的背景。UMI轻量便携、易于使用，一方面降低了采集成本，更重要的是让数据采集摆脱了固定场地的限制，使得任何人都能在室内外的真实场景中自然操作，从而采集到更贴近现实分布的数据，弥补了数据采集厂与真实世界之间的差距。

然而，当UMI被业界认可并逐渐大规模使用时，新的问题也随之显现：在自由开放的场景中，数据质量控制变得困难。动作是否有效？轨迹是否合理？采集节奏是否适合训练？这些问题往往要到数据回传、清洗并开始训练的后处理阶段才能发现。大量低价值数据进入管线，推高了清洗与返工成本，拉长了训练周期。

因此，UMI面临一个“不可能三角”的挑战——采集质量、使用便捷性与后处理压力三者难以同时优化。追求采集质量可能牺牲便携性；提高便携性（如仅依赖腕部模组）又难以保证数据可用性；若依赖后处理兜底，则需承受高昂的清洗筛选成本，拖慢训练闭环。

现有的UMI方案并未解决“采集的数据能否直接用于训练”这一核心问题。于是，穹彻团队决定回归问题原点，从一个关键设想出发：如果模型训练最终需要对数据进行判断与筛选，为何不将这一过程前置到采集阶段？

这一设想着手实现意味着采集逻辑、平台架构乃至成本结构都需要改变。而RoboPocket首次将其变成了现实。

内置实时运行的“数据价值中枢系统”

与传统UMI设备相比，RoboPocket的关键变革在于重新定义了采集目标。

传统UMI的默认目标是“记录人类操作行为”，即尽可能完整地还原任务执行过程。这在训练初期能为模型提供基本行为模板，但随着模型需要处理更高维度、更长时序、更复杂的场景，仅记录动作本身已不足以满足训练需求。

RoboPocket将采集目标转向了弥补模型的“能力缺口”——模型还不会的，才是最值得采集的数据。

基于此理念，RoboPocket系统内置了一套实时运行的“数据价值中枢系统”。这套系统不再等待采集完成后才进行评估，而是在数据生成的当下，就开始实时判断其价值。

这要求对模型训练有深刻理解。穹彻智能与上海交通大学卢策吾团队长期从事具身模型训练与数据闭环研究，既具备采集工具开发经验，也深谙模型训练、评估与数据回流的完整闭环。他们清楚哪些数据能成为有效训练信号，哪些是冗余干扰，也了解模型在不同任务维度上的短板及应如何弥补。这种基于长期实践的理解能力是其核心优势。

在采集过程中，RoboPocket同步完成三件事：
* 第一，实时评估：在每一帧数据生成时，系统判断其是否包含有效的训练信号，如操作完整性、动作轨迹合理性、场景信息量等。
* 第二，即时引导：若系统检测到采集者的操作可能低效或错误（如动作过快、夹爪超界、多样性不足），会实时发出提醒，引导调整，避免产生低价值数据。

* 第三，动态调度：这一环节直接接入当前模型的性能评估结果。系统根据模型在不同任务维度上的表现，识别出最需要补齐的样本类型，并实时向采集者分发相应的高优先级采集任务。

简而言之，RoboPocket如同一个24小时待命的“数据采集主理人”，即时诊断数据质量，智能指导采集动作，并动态评估数据价值，为后续处理提供筛选依据。这使得数据在采集阶段就与训练目标紧密贴合，显著减少冗余，让训练信号更加集中。

穹彻团队表示，采用RoboPocket采集的数据在训练中展现出显著优势。尤其在开放复杂环境的多步骤任务中，模型执行的稳定性更强，不易受光照、背景变化或干扰影响，能准确识别上下文意图，在不确定情境下保持清晰的目标推进逻辑。无论是零食分拣装袋还是毛巾折叠整理，模型都能保持稳定、高效的双臂协同与长序列操作能力。

此外，在环境更复杂、干扰更多的场景下，模型也能维持较高的成功率和一致性。这显现出一个重要趋势：得益于采集过程更贴近真实任务分布，模型开始从“能够粗糙完成任务”向“能在非理想条件下可靠完成任务”演进。数据采集本身成为一种针对模型能力短板的、持续的行为，具备了闭环属性。一旦采集与训练形成实时联动，整个数据系统的运行效率将得到质的提升。