2ヶ月前
効果的な顔認識のために本当に何百万もの顔を集めなければならないのでしょうか?
Iacopo Masi; Anh Tuan Tran; Jatuporn Toy Leksut; Tal Hassner; Gerard Medioni

要約
顔認識能力は最近、著しい進歩を遂げています。この進歩は部分的に、大量の顔画像がダウンロードされ、アイデンティティのためにラベリングされた膨大な訓練データセットの増加に起因していますが、そのような多数の画像を集めるという困難な作業が本当に必要であるかどうかは明確ではありません。本研究では、顔認識システムの訓練データサイズを大幅に増加させるためのよりアクセスしやすい方法を提案します。手動でさらに多くの顔を収集し、ラベリングする代わりに、単にそれらを合成します。既存のデータセットに重要な顔の外観変異を追加するための新しい手法について説明します。これは、含まれる顔を操作することによって達成されます。さらに、標準的な畳み込みニューラルネットワークを使用してクエリ画像を表現する際に、この合成アプローチを適用しています。合成画像を使用して訓練およびテストを行う効果は、LFW および IJB-A(認証と識別)ベンチマークと Janus CS2 で広範囲にわたって検証されています。当方針により得られた性能は、数百万枚のダウンロードされた画像で訓練されたシステムが報告している最先端の結果と匹敵しています。