英伟达R²D²突破:三项神经技术革新重塑机器人学习未来
NVIDIA Research最新发布的《机器人研发简报》(R²D²)揭示了三项突破性神经技术,正加速机器人从实验室走向真实世界。尽管当前机器人在受控环境中表现优异,但在应对复杂、多变的真实任务时仍面临挑战,如精密装配、日常物品操作等。这些新技术为解决机器人学习中的关键瓶颈提供了全新路径。 第一项突破是NeRD(Neural Robot Dynamics),一种基于神经网络的动态预测模型。它能高效模拟高自由度机器人在接触约束下的复杂运动,替代传统物理引擎中的低级求解器,构建混合仿真框架。NeRD采用以机器人为中心的状态表示,具备空间不变性,显著提升训练效率与泛化能力。通过10万条随机轨迹数据训练,其在1000步预测中误差低于0.1%,并成功实现零样本“仿真到现实”的迁移——例如Franka机械臂在仿真中学习的抓取策略可直接应用于真实场景,且可通过真实数据微调进一步缩小差距。 第二项技术是参考范围探索(RSE),用于从人类动作捕捉数据中学习机器人手部灵巧操作。传统方法需经历重定向、跟踪和残差校正三步,易累积误差。RSE则将三者整合为单一优化流程,将人类示范视为“软性指导”而非严格指令,使机器人能根据自身结构自主探索可行动作。结合视觉生成控制策略,该方法使Inspire机械手在抓取香蕉、手机等物体时成功率提升近20%,并可在仅依赖单视角深度图像和模糊目标的情况下完成多样操作。 第三项是VT-Refine框架,专为双臂高精度装配任务设计,融合视觉与触觉反馈。该框架通过少量真实演示(如30次)预训练一个双臂视觉-触觉扩散策略,再在数字孪生环境中利用强化学习进行大规模仿真优化,最终部署至真实机器人。其仿真中采用GPU加速的触觉模拟库TacSL,实现对传感器柔软特性的高效建模。实验表明,该方法使真实世界成功率提升约20%(视觉)至40%(视觉+触觉),尽管存在5%-10%的仿真到现实性能衰减,但整体提升远超代价。 这三项技术共同推动机器人学习向更高效、更真实、更智能的方向迈进。NeRD提升仿真精度,RSE简化人类技能迁移,VT-Refine实现多模态感知下的精准协作。它们标志着数据驱动的神经方法正逐步弥合机器人与人类操作能力之间的鸿沟。相关成果将在2025年9月27日至10月2日于韩国首尔举行的CoRL与Humanoids会议上展出。
