
要約
顔検出は、領域ベースの手法を使用することで大きな成功を収めています。本報告書では、深層ネットワークを完全に畳み込み型で適用した領域ベースの顔検出器「Face R-FCN」を提案します。Region-based Fully Convolutional Networks (R-FCN) を基盤としており、当社の顔検出器は、従来の R-CNN ベースの顔検出器と比較してより正確かつ計算効率が良いです。当社のアプローチでは、完全に畳み込み型の Residual Network (ResNet) をバックボーンネットワークとして採用しています。特に、位置感度のある平均プーリング、マルチスケールでの学習とテスト、オンラインでの難例抽出戦略などの新しい技術を活用し、検出精度を向上させています。最も人気があり挑戦的な顔検出ベンチマークである FDDB および WIDER FACE において、Face R-FCN は最先端技術を超える優れた性能を達成しています。