
要約
顔検出は、コンピュータビジョン分野で最も研究が進んでいるトピックの一つです。多くの進展は、顔検出ベンチマークデータセットの利用可能性によって達成されました。本稿では、現在の顔検出性能と実世界の要件との間にギャップがあることを示します。今後の顔検出研究を促進するため、WIDER FACEデータセットを紹介します。このデータセットは既存のデータセットよりも10倍大きい規模を持っています。データセットには豊富なアノテーションが含まれており、遮蔽(occlusions)、姿勢(poses)、イベントカテゴリ(event categories)、および顔のバウンディングボックス(face bounding boxes)が記載されています。提案されたデータセットに含まれる顔は、スケール、姿勢、遮蔽の大きな変動により非常に難易度が高いことが図1に示されています。さらに、WIDER FACEデータセットが顔検出の効果的な学習源であることを示します。代表的な検出システムをいくつかベンチマーク評価し、最先端の性能概要を提供するとともに、大規模な変動に対処するための解決策を提案します。最後に、さらなる調査が必要な一般的な失敗ケースについて議論します。データセットは以下のURLからダウンロードできます:mmlab.ie.cuhk.edu.hk/projects/WIDERFace