2ヶ月前

DigiFace-1M: 顔認識用の100万枚のデジタル顔画像

Gwangbin Bae; Martin de La Gorce; Tadas Baltrusaitis; Charlie Hewitt; Dong Chen; Julien Valentin; Roberto Cipolla; Jingjing Shen
DigiFace-1M: 顔認識用の100万枚のデジタル顔画像
要約

最先端の顔認識モデルは、Labeled Faces in the Wild (LFW) データセットで99.8%以上の精度を達成しており、その性能は印象的です。これらのモデルは、インターネットから収集された何百万もの実際の人間の顔画像を含む大規模なデータセットで訓練されています。ウェブクロールされた顔画像は、人種、照明、メイクアップなどの観点で著しく偏っており、しばしばラベルノイズが含まれています。さらに重要なのは、これらの顔画像は明示的な同意なしに収集されているため、倫理的な懸念が生じることです。このような問題を避けるために、コンピュータグラフィックスパイプラインを使用してデジタル顔をレンダリングすることで得られる大規模な合成データセットを導入します。まず、積極的なデータ拡張が合成領域と実際の領域とのギャップを大幅に縮められることを示します。レンダリングパイプラインを完全に制御しているため、各属性(例:顔の角度の変動、アクセサリー、テクスチャなど)が精度にどのように影響するかについても研究を行いました。最近のGAN生成合成顔画像で訓練されたSynFaceと比較すると、LFWでの誤り率を52.5%削減し(精度が91.93%から96.17%へ向上)、同意を得て合理的に入手可能な少数の実際の顔画像でネットワークを微調整することにより、何百万もの実際の顔画像で訓練された方法と同等の精度を達成しました。

DigiFace-1M: 顔認識用の100万枚のデジタル顔画像 | 最新論文 | HyperAI超神経