
要約
既存の多くのエンドツーエンドのステアリング角度予測モデルの訓練は、ステアリング角度を教師信号として大きく依存しています。これらの手法は、豊かなコンテキストから学習しないため、急な道路カーブ、困難な交通状況、強い影、および激しい照明変化などの存在に脆弱です。本論文では、異種補助ネットワークの特徴模倣(feature mimicking)という新しい効果的な訓練方法を用いて、予測の精度と堅牢性を大幅に向上させます。この方法により、ステアリング方向以外にも豊かなコンテキスト情報を提供することが可能になります。具体的には、関連するが異なるタスク(例えば画像セグメンテーションや光学フロー推定)を行う複数の異種補助ネットワークから多層的な知識を抽出して、ステアリング角度予測モデルを訓練します。マルチタスク学習とは異なり、当手法は目標セット上で関連タスクの高コストな注釈を必要としません。これは、現代のオフザシェルフネットワークを目標セットに適用し、その特徴量を異なる層で変換後に模倣することで実現されます。訓練後は補助ネットワークが廃棄されますが、当モデルの実行時の効率性には影響を与えません。当アプローチはUdacityおよびComma.aiデータセットにおいて新たな最先端の成果を達成し、それぞれ前の最良結果に対して12.8%および52.1%の大差で上回りました。Berkeley Deep Drive (BDD) データセットでも有望な結果が示されています。