机器人公司头疼的,往往不是"没有视频",而是"视频变不成训练数据"。具身智能的瓶颈,正在从"采多少",转向"怎么把采到的变成模型能学的"。
采集有三条路,各有取舍
- 本体采集(真机遥操作):直接拿到机器人关节角与末端动作,保真度更高,但慢、贵;
- 无本体采集(第一视角视频 / 手持采集器):便宜、可规模化,但拿到的是人手姿态,需要估计与重定向才能用;
- 仿真合成:几乎无限量,但要处理仿真到真实的差距。
没有哪一条单独够用。真实世界数据的价值,来自把它们组合成目标机器人能直接训练的形态。
跨本体重定向:一次采集,多个本体复用
一个常被低估的成本是:换一种夹爪、换一台机械臂,就要重新采一遍。我们用重定向(retargeting)把一次采集适配到不同的夹爪与机械臂,配合合成增广放大数据量,降低"为每个本体重复采集"的代价。
交付即取即用
轨迹数据集兼容 LeRobot / Open X-Embodiment;场景资产输出 URDF / MJCF / USD,可在 Isaac Sim、MuJoCo、Genesis 等仿真器里直接加载,面向主流策略与 VLA 栈即取即用。数据全程境内、合规交付。
把"难以变成训练数据的真实世界视频",变成机器人即取即用的数据——这是我们在做的事。
提壶智能