
要約
運転は、多様な複雑な環境条件やエージェントの行動に反応する必要がある。各可能なシナリオを明示的にモデル化することは現実的ではない。対照的に、模倣学習は理論上、大量の人間が運転する車両から得られるデータを活用できる。特に、行動クローンニングは単純な視覚運動ポリシーをエンドツーエンドで学習するために成功裏に使用されてきたが、すべての運転行動をカバーするスケーリングは未解決の問題である。本論文では、行動クローンニングのスケーラビリティと限界を実験的に調査する新しいベンチマークを提案する。我々は、行動クローンニングが未知の環境でも最先端の結果を導き出すことを示す。これは、複雑な横方向および縦方向の操縦を行えることからも明らかであり、これらの反応が明示的にプログラムされていないにもかかわらず達成されている。しかし、既知の制約(データセットバイアスと過学習によるもの)や新たな汎化問題(動的物体や因果関係モデルの欠如によるもの)、さらには訓練の不安定性について確認しており、これらの課題が解決されるまで行動クローンニングが実世界の運転に適用されることはないだろう。研究した行動クローンニング手法のコードは https://github.com/felipecode/coiltraine で入手可能である。以上が翻訳となります。ご確認ください。