11日前

自律走行における効率的な歩行者検出のための局所的意味特徴ミキサー

{Andreas Dengel, Mohammed Shariq Nawaz, Abdul Hannan Khan}
自律走行における効率的な歩行者検出のための局所的意味特徴ミキサー
要約

自律走行システムは、リアルタイムでの正確な判断を可能にするために、高性能かつ効率的な周辺認識モジュールに大きく依存している。自律走行システムにおいて、歩行者との衝突を回避することは最優先事項であるため、歩行者検出はこうしたシステムの認識モジュールにおける核心的な要素の一つである。現在の最先端歩行者検出器には、大きく分けて二つの問題点がある。第一に、推論時間が長く、全体の認識モジュールの効率性を損なう点であり、第二に、小型または重度に隠蔽された歩行者に対する検出性能が低い点である。本研究では、新たなアンカーフリー歩行者検出アーキテクチャである「Localized Semantic Feature Mixers(LSFM)」を提案する。このアーキテクチャは、計算コストが高い特徴ピラミッドネットワーク(Feature Pyramid Networks)の代わりに、我々が独自に開発した「スーパーピクセルピラミッドプーリング(Super Pixel Pyramid Pooling)」モジュールを用いて特徴エンコーディングを行う。さらに、MLPMixerに基づく「Dense Focal Detection Network」を検出ヘッドとして採用することで、従来手法と比較して計算負荷と推論時間を大幅に削減している。提案アーキテクチャの性能を向上させるために、混成増強法(mixup augmentation)を適応・適用し、特に小型および重度に隠蔽された歩行者に対する検出性能の向上を実現した。LSFMは、広く用いられている交通シーン用歩行者データセット(Caltech、City Persons、Euro City Persons、TJU-Traffic-Pedestrian)において、最先端の手法と比較して、いずれのデータセットでも最先端の性能を達成するとともに、平均して推論時間を55%削減した。さらに、本研究は、歩行者検出の歴史において初めて、人間の検出性能を上回る成果を達成した。最後に、クロスデータセット評価を実施した結果、LSFMが未観測のデータに対しても良好な汎化性能を示すことが確認された。