
摘要
驾驶需要对各种复杂的环境条件和代理行为做出反应。显式建模每一种可能的情景是不现实的。相比之下,模仿学习理论上可以利用来自大量人类驾驶汽车的数据。特别是,行为克隆已被成功用于端到端学习简单的视觉-运动策略,但将其扩展到完整的驾驶行为范围仍然是一个未解决的问题。在本文中,我们提出了一种新的基准测试方法,以实验性地研究行为克隆的可扩展性和局限性。我们展示了行为克隆在包括未知环境中执行复杂横向和纵向操作时能够取得最先进的结果,而这些反应并未被显式编程。然而,我们证实了已知的局限性(由于数据集偏差和过拟合),以及新的泛化问题(由于动态物体和缺乏因果模型),并且在行为克隆能够应用于实际驾驶之前,仍需进一步研究以解决训练不稳定的问题。所研究的行为克隆方法的代码可以在 https://github.com/felipecode/coiltraine 找到。