4ヶ月前
スケール対応型 Fast R-CNN による歩行者検出
Jianan Li; Xiaodan Liang; ShengMei Shen; Tingfa Xu; Jiashi Feng; Shuicheng Yan

要約
本研究では、自然環境における歩行者検出の問題を取り扱います。直感的に、異なる空間スケールを持つ歩行者のインスタンスは、著しく異なる特徴を示す可能性があります。したがって、インスタンスのスケールに大きな変動があると、カテゴリ内の特徴にも望ましくない大きな変動が生じ、現代のオブジェクトインスタンス検出手法の性能を大幅に損なう可能性があります。私たちは、この問題を分割統治(divide-and-conquer)の哲学によって大幅に軽減できると考えています。歩行者検出を例にとって、この哲学を利用して Scale-Aware Fast R-CNN (SAF R-CNN) フレームワークを開発する方法について説明します。モデルは、互いに排他的な範囲のスケールを持つ歩行者を検出する複数の内蔵サブネットワークを導入します。これらのサブネットワークからの出力は、オブジェクト提案のサイズに基づいて定義されたゲート関数を通じて適応的に結合され、最終的な検出結果が生成されます。この結果は、インスタンスのスケールに大きな変動がある場合でも堅牢であることが示されています。いくつかの挑戦的な歩行者検出データセットでの広範な評価により、提案された SAF R-CNN の有効性が十分に実証されました。特に、私たちの手法は Caltech, INRIA, および ETH で最先端の性能を達成し、KITTI でも競争力のある結果を得ています。