16 天前

融入第一人称定位的更真实点目标导航Agent

Samyak Datta, Oleksandr Maksymets, Judy Hoffman, Stefan Lee, Dhruv Batra, Devi Parikh
融入第一人称定位的更真实点目标导航Agent
摘要

近期研究已提出能够以近乎完美的准确率在全新室内环境中导航至点目标的具身智能体。然而,这些智能体依赖理想化的传感器进行定位,并执行确定性动作。与现实世界中传感器噪声和执行误差的复杂情况相比,这种设定在实际应用中显得过于理想化——例如,轮子可能发生打滑,运动传感器存在偏差,动作执行可能产生反弹。在本工作中,我们朝着更真实的噪声环境迈出一步,提出了一种基于视觉估计自身运动(egomotion)的点目标导航智能体,其能够在存在噪声的动作动态条件下运行。实验结果表明,该智能体在性能上优于当前点目标导航智能体在该噪声环境下的简单适应版本,也优于引入经典定位基准方法的方案。此外,我们的模型在概念上实现了对智能体动态建模(即里程计,回答“我在哪里?”)与任务特定导航策略(回答“我想去哪里?”)的解耦。这一设计使得在面对动态变化(如更换机器人或地面类型)时,仅需重新校准视觉里程计模型即可实现无缝适应,而无需重新训练复杂的导航策略,从而显著降低了系统迁移的成本。该智能体在2020年CVPR Habitat挑战赛的PointNav赛道中获得亚军。

融入第一人称定位的更真实点目标导航Agent | 最新论文 | HyperAI超神经