マスク付き顔を生成する現実的なアプローチ:2つの新規マスク付き顔認識データセットへの応用

新型コロナウイルス感染症(COVID-19)パンデミックにより、人々が鼻と口を覆う手術用マスクを着用するという新たな状況に対応するため、顔認識システムの適応が重要な課題となっている。従来の顔認識システムの学習に用いられるデータセット(例:CelebA、CASIA-WebFace)はパンデミック以前に公開されたものであり、マスク着用者の画像がほとんど含まれていないため、現在の状況には不適切であるとされている。本研究では、マスクを着用していない顔を含む既存データセットを拡張するため、合成マスクを生成し、元の画像の顔に重ねる手法を提案する。本手法は、フェイスブックが開発したInstagram用顔フェイスフィルター作成用の開発ツール「SparkAR Studio」を活用している。本手法では、色、形状、素材の異なる9種類のマスクを用いて、CASIA-WebFaceデータセットに対して445,446(90%)枚、CelebAデータセットに対して196,254(96.8%)枚のマスク着用画像を生成した。これらのマスク画像は、GitHub(https://github.com/securifai/masked_faces)にて公開している。本手法が、他の同様のタスク向けに設計された手法やデータセットと比較して、参加者による定性的評価において、顔にマスクが重ねられた画像の現実性が著しく高いことを示した。さらに、本手法で拡張したデータセットを用いて学習させた最先端の顔認識システム(FaceNet、VGG-face、ArcFace)を評価した結果、テストベンチマークにマスク着用の顔が含まれる状況下では、元のデータセット(マスク非着用の顔のみ)または類似手法で生成されたマスク画像を含む競合データセットを用いて学習したシステムと比較して、顔認識性能が優れていることが実証された。