
要約
顔認識(FR)においては顕著な進展が見られますが、半制約的な学習データセットと非制約的なテスト環境との間に存在するドメインギャップのため、非制約環境下でのFRは依然として困難な課題です。この問題に対処するため、我々はスタイル潜在空間においてターゲットデータセットの分布を模倣可能な制御可能な顔合成モデル(CFSM)を提案します。CFSMはスタイル潜在空間内で直交基底を持つ線形部分空間を学習し、合成の多様性および合成の度合いを精密に制御することが可能になります。さらに、事前に学習された合成モデルはFRモデルによってガイドされ、生成される画像がFRモデルの訓練により効果的に寄与するようになります。また、学習された直交基底によりターゲットデータセットの分布が特徴づけられ、これにより異なる顔データセット間の分布類似度を測定することが可能になります。本手法は、IJB-B、IJB-C、TinyFace、IJB-Sといった非制約ベンチマークにおいて顕著な性能向上を達成し、Rank1スコアで最大+5.76%の改善を示しました。