2ヶ月前

Wasserstein CNN: NIR-VIS顔認識のための不変特徴量の学習

He, Ran ; Wu, Xiang ; Sun, Zhenan ; Tan, Tieniu
Wasserstein CNN: NIR-VIS顔認識のための不変特徴量の学習
要約

異種顔認識(HFR)は、法医学、セキュリティ、商業部門における重要なミッションに向け、異なるセンシングモダリティから取得された顔画像を照合することを目指しています。しかし、HFRは伝統的な顔認識よりもはるかに困難な問題であり、これは異種顔画像の大きなクラス内変動とクロスモダリティの顔画像ペアの限られた訓練サンプルによるものです。本論文では、近赤外線と可視光線の顔画像間(すなわちNIR-VIS顔認識)で不変特徴を学習する新しい手法であるワッサーステインCNN(畳み込みニューラルネットワーク、またはWCNNと略す)を提案します。WCNNの低層は、可視スペクトルで広く利用可能な顔画像を使用して訓練されます。高層は3つの部分に分割され、すなわちNIR層、VIS層、NIR-VIS共有層です。最初の2つの層はモダリティ固有の特徴を学習することを目的としており、NIR-VIS共有層はモダリティ不変の特徴空間を学習するために設計されています。ワッサーステイン距離がNIR-VIS共有層に導入され、異種特徴分布間の相違度を測定するために使用されます。したがって、W-CNN学習は異種顔画像に対する不変な深層特徴表現を得るために、NIR分布とVIS分布間のワッサーステイン距離の最小化を目指します。小規模な異種顔データでの過学習問題を避けるために、WCNNネットワークの全結合層に対して相関事前情報を導入し、パラメータ空間を削減します。この事前情報はエンドツーエンドネットワークにおいて低ランク制約によって実装されます。共同式により、訓練段階では深層特徴表現に対する交互最小化が行われ、テスト段階では効率的な計算が可能となります。3つの挑戦的なNIR-VIS顔認識データベースにおける広範な実験結果は、ワッサーステインCNNが最先端手法に対して著しい優位性を持つことを示しています。

Wasserstein CNN: NIR-VIS顔認識のための不変特徴量の学習 | 最新論文 | HyperAI超神経