HyperAI超神经
2 days ago

多样性是否足以实现可扩展的机器人操作?

Modi Shi, Li Chen, Jin Chen, Yuxiang Lu, Chiming Liu, Guanghui Ren, Ping Luo, Di Huang, Maoqing Yao, Hongyang Li
多样性是否足以实现可扩展的机器人操作?
摘要

数据规模在自然语言处理(NLP)和计算机视觉(CV)的基础模型中取得了显著的成功,然而,机器人操作中有效数据规模化的原理仍不够明确。在这项研究中,我们通过考察任务(做什么)、实体形式(使用哪个机器人)和专家(谁进行演示)这三个关键维度,探讨了数据多样性在机器人学习中的复杂作用,挑战了“更多样性更好”的传统观念。通过在多种机器人平台上进行广泛的实验,我们揭示了以下几点:(1) 任务多样性比每个任务的演示数量更为重要,有助于从多样化的预训练任务向新的下游场景迁移;(2) 跨实体形式的预训练数据对于跨实体形式迁移是可选的——在高质量单实体形式数据上训练的模型可以高效地迁移到不同的平台,在微调过程中表现出比多实体形式预训练模型更理想的规模化特性;(3) 专家多样性,源于个人操作偏好和人类演示中的随机变化,可能对策略学习产生混淆效应,其中速度多模态性成为一个关键的影响因素。基于这一见解,我们提出了一种分布去偏方法以减轻速度模糊性问题,该方法使得改进后的GO-1-Pro性能提升了15%,相当于使用了2.5倍的预训练数据。总体而言,这些发现提供了新的视角,并为如何有效地扩展机器人操作数据集提供了实用指导。