
要約
顔検出は、深層畳み込みニューラルネットワーク(CNN)の進歩により著しい進展を遂げています。近年の中心的な課題は、小さな顔の検出性能を向上させることです。この課題に対処するため、多くの最近の研究では特定の戦略を提案し、アーキテクチャを再設計し、新たな損失関数を導入しています。本報告書では、人気のある一段階RetinaNetアプローチから始め、いくつかの最近の手法を適用して高性能な顔検出器を開発しました。具体的には、回帰のためにIntersection over Union (IoU) 損失関数を使用し、検出のために二段階分類と回帰を行いました。また、データ拡張に基づくデータアンカーサンプリングによる訓練を見直し、分類のためにmax-out操作を利用し、推論のために多尺度テスト戦略を使用しました。その結果、提案された顔検出方法は最も人気があり困難な顔検出ベンチマークであるWIDER FACEデータセットで最先端の性能を達成しました。