11日前

漸近的局所化適合を用いた効率的な単段階歩行者検出器の学習

{Xuezhi Liang, Shengcai Liao, Weidong Hu, Wei Liu, Xiao Chen}
漸近的局所化適合を用いた効率的な単段階歩行者検出器の学習
要約

Faster R-CNNに基づく2段階検出器は、歩行者検出の精度において顕著な向上を遂げてきたが、実用応用においては依然として速度が遅いという課題がある。その解決策の一つとして、この処理フローを単段階検出器に簡略化するアプローチが検討されている。しかし、現在の単段階検出器(例:SSD)は、一般的な歩行者検出ベンチマークにおいて競争力のある精度を示せていない。本論文では、SSDの高速性を活かしつつ、Faster R-CNNの精度を維持する成功した歩行者検出器の実現を目指す。具体的には、構造的に単純ながら効果的なモジュール「漸近的局所化適合(Asymptotic Localization Fitting: ALF)」を提案する。このALFモジュールは、SSDのデフォルトアンカー・ボックスを段階的に予測器の系列によって直接改善していくことで、検出結果を逐次的に向上させる。その結果、学習過程において後段の予測器はより多く、より質の高い陽性サンプルを獲得できる一方で、IoU閾値を段階的に上げることでより困難な負例(hard negatives)を掘り出すことが可能となる。さらに、このALFモジュールを基盤とした効率的な単段階歩行者検出アーキテクチャ(ALFNet)を設計した。ALFNetは、歩行者検出の代表的な大規模ベンチマークであるCityPersonsおよびCaltechにおいて、最先端の性能を達成し、精度と速度の両面で魅力的な歩行者検出器としての実用性を示している。コードは以下のリンクから公開されている:\href{https://github.com/VideoObjectSearch/ALFNet}{https://github.com/VideoObjectSearch/ALFNet}。

漸近的局所化適合を用いた効率的な単段階歩行者検出器の学習 | 最新論文 | HyperAI超神経