17日前

汎用性のある歩行者検出:部屋にいる象

Irtiza Hasan, Shengcai Liao, Jinpeng Li, Saad Ullah Akram, Ling Shao
汎用性のある歩行者検出:部屋にいる象
要約

歩行者検出は、動画監視から自動運転に至るまで、多くの視覚ベースの応用分野で利用されている。高精度を達成しているものの、既存の検出器が未観測のデータに対してどれほど良好に一般化するかについては、依然として十分に理解されていない。これは実用的な検出器がさまざまなシナリオに対応できるよう設計されるべきであるため、極めて重要である。本研究では、直接的なデータセット間評価という一般的な原則に基づき、包括的な調査を実施する。その結果、現在の最先端歩行者検出器は、同一データセット上で学習・評価される場合には非常に良好な性能を発揮するものの、データセット間評価では著しく一般化能力に欠けることが明らかになった。この傾向の理由として、2つの要因が存在することを示した。第一に、検出器の設計(例えばアンカーの設定)が従来の単一データセット学習・評価パイプラインにおける人気ベンチマークに偏っている可能性があり、その結果、一般化能力が大きく制限されている。第二に、学習に用いるデータソースは歩行者の密度が低く、シナリオの多様性に欠けていることが一般的である。直接的なデータセット間評価において、驚くべきことに、歩行者に特化した設計変更を施さない汎用物体検出器が、既存の最先端歩行者検出器よりもはるかに優れた一般化性能を示すことがわかった。さらに、ウェブクローリングにより収集された多様で高密度のデータセットが、歩行者検出の事前学習に効果的なソースとなることを示した。これに基づき、段階的な学習パイプラインを提案し、自動運転向け歩行者検出において良好な性能を発揮することを確認した。したがって、本研究は、今後の汎用性の高い歩行者検出器の設計において、データセット間評価への重視が不可欠であることを示唆している。コードおよびモデルは、https://github.com/hasanirtiza/Pedestron で公開されている。