16日前

WebFace260M:ミリオンスケール深層顔認識の力を解き放つベンチマーク

Zheng Zhu, Guan Huang, Jiankang Deng, Yun Ye, Junjie Huang, Xinze Chen, Jiagang Zhu, Tian Yang, Jiwen Lu, Dalong Du, Jie Zhou
WebFace260M:ミリオンスケール深層顔認識の力を解き放つベンチマーク
要約

本稿では、ノイズを含む400万ID/2億6000万枚の顔画像(WebFace260M)およびクリーニング済みの200万ID/4200万枚の顔画像(WebFace42M)を含む、ミリオンスケールの顔認識ベンチマークを提供するとともに、時間制約を考慮した精巧な評価プロトコルを構築する。まず、400万件の人物名リストを収集し、インターネットから2億6000万枚の顔画像をダウンロードした。次に、自己学習を活用した自動クリーニング(CAST)パイプラインを設計し、膨大なWebFace260Mデータを効率的かつスケーラブルにクリーニングした。筆者らの知る限り、クリーニング済みのWebFace42Mは現在、公開されている最大規模の顔認識学習データセットであり、学術界と産業界の間のデータギャップを埋めることを期待している。実用的なシナリオを踏まえ、推論時間制約下での顔認識(FRUITS)プロトコルとそのテストセットを構築し、顔マッチング手法の包括的な評価を可能にした。このベンチマークを基盤として、ミリオンスケールの顔認識問題に深く探求した。性能を損なうことなく効率的に顔認識モデルを学習するための分散型フレームワークを開発した。WebFace42Mを活用することで、難易度の高いIJB-Cデータセットにおいて失敗率を相対的に40%削減し、NIST-FRVTにおける430件の参加エントリの中で3位を達成した。また、10%のデータ(WebFace4M)でも、既存の公開学習データセットを上回る性能を示した。さらに、FRUITS-100ms/500ms/1000msという時間制約プロトコルのもとで、豊富な属性を備えたテストセット上で、MobileNet、EfficientNet、AttentionNet、ResNet、SENet、ResNeXt、RegNetなどの主要なネットワークファミリを含む包括的なベースラインを構築した。ベンチマークの公式ウェブサイトは https://www.face-benchmark.org である。

WebFace260M:ミリオンスケール深層顔認識の力を解き放つベンチマーク | 最新論文 | HyperAI超神経