2ヶ月前
VGGFace2: 姿勢と年齢を横断して顔認識を行うためのデータセット
Qiong Cao; Li Shen; Weidi Xie; Omkar M. Parkhi; Andrew Zisserman

要約
本論文では、新しい大規模な顔画像データセットであるVGGFace2を紹介します。このデータセットには、9,131人の被験者に関する331万枚の画像が含まれており、各被験者の平均画像数は362.6枚です。画像はGoogle Image Searchからダウンロードされ、姿勢、年齢、照明、民族性、職業(例:俳優、アスリート、政治家)などに大きな変動があります。このデータセットは以下の3つの目標を持って収集されました:(i) 多数の個人を含みつつ、各個人についても多数の画像を持つこと;(ii) 姿勢、年齢、民族性の広い範囲をカバーすること;(iii) ラベルノイズを最小限に抑えること。データセットの収集方法について説明します。特に、各個人の画像に対する高精度を確保するために行われた自動フィルタリングと手動フィルタリングの段階について詳細に述べます。新規データセットを使用した顔認識性能を評価するために、VGGFace2上およびMS-Celeb-1M上(両者の結合も含む)でResNet-50(Squeeze-and-Excitationブロックあり・なし)畳み込みニューラルネットワークを訓練し、VGGFace2での訓練が姿勢や年齢における認識性能の向上につながることを示しました。最後に、これらのデータセットで訓練されたモデルを使用して、IARPA Janus顔認識ベンチマーク(IJB-A, IJB-B, IJB-Cなど)において最先端の性能を達成したことを示します。以前の最先端技術を超える大幅な改善が見られました。データセットとモデルは公開されています。