11日前
ASFD:自動且スケーラブルな顔検出器
Jian Li, Bin Zhang, Yabiao Wang, Ying Tai, ZhenYu Zhang, Chengjie Wang, Jilin Li, Xiaoming Huang, Yili Xia

要約
現在のマルチスケールベースの検出器に加えて、特徴量集約・強化(Feature Aggregation and Enhancement; FAE)モジュールは、最先端の物体検出において優れた性能向上を示している。しかし、こうした手作業で設計されたFAEモジュールは、顔検出において一貫した改善効果を示さないことがあり、その主な原因は、学習に用いられるデータセット(COCO)と実用時に用いるデータセット(WIDER Face)のデータ分布の顕著な違いにある。この問題に対処するため、本研究ではデータ分布の影響を本質的に分析し、異なるiableアーキテクチャ探索(differentiable architecture search)を用いて、顔検出において既存のすべてのFAEモジュールを大きく上回る効果を持つ新たなFAEアーキテクチャ、AutoFAEを探索することを提案する。得られたAutoFAEと既存のバックボーンを組み合わせて、さらにスーパーネット(supernet)を構築・訓練し、異なる計算複雑度の制約下で自動的に複数の検出器のファミリーを生成できるようにした。WIDER FaceおよびFDDBという代表的なベンチマーク上で実施された広範な実験により、本研究で提案する自動的かつスケーラブルな顔検出器(ASFD)ファミリーが、最先端の性能-効率のトレードオフを達成することが実証された。特に、強力なASFD-D6は、WIDER FaceテストセットにおいてAP 96.7/96.2/92.1を達成し、最良の競合手法を大きく上回った。また、軽量版のASFD-D0は、V100 GPU上でVGA解像度の画像処理に約3.1 msを要し、320 FPS以上を実現している。