2ヶ月前
高性能顔検出のための選択的精緻化ネットワーク
Cheng Chi; Shifeng Zhang; Junliang Xing; Zhen Lei; Stan Z. Li; Xudong Zou

要約
高性能な顔検出は依然として非常に困難な問題であり、特に小さな顔が多数存在する場合にその難易度は高まります。本論文では、新しい単一ショット顔検出器であるSelective Refinement Network (SRN)を提案します。SRNは、アンカーベースの顔検出器に新たな二段階の分類と回帰操作を選択的に導入することで、偽陽性を削減しつつ位置精度を向上させることが可能です。特に、SRNは以下の2つのモジュールで構成されています:Selective Two-step Classification (STC) モジュールとSelective Two-step Regression (STR) モジュールです。STCは、低レベルの検出層から大部分の簡単な否定的なアンカーをフィルタリングし、その後の分類器の探索範囲を縮小することを目指しています。一方、STRは高レベルの検出層からのアンカーの位置とサイズを粗く調整し、その後の回帰器に更好的初期化を提供するために設計されています。さらに、我々は受容野強化 (Receptive Field Enhancement, RFE) ブロックを設計しました。このブロックによりより多様な受容野が得られ、極端な姿勢にある顔をよりよく捉えることができます。その結果、提案されたSRN検出器はAFW, PASCAL face, FDDB, およびWIDER FACEデータセットなど広く使用されているすべての顔検出ベンチマークで最先端の性能を達成しています。また、コードが公開される予定であり、顔検出問題に関するさらなる研究を促進することが期待されます。