HyperAIHyperAI

Command Palette

Search for a command to run...

ワッサーシュタインCNN:NIR-VIS顔認識のための不変特徴の学習

He Ran Wu Xiang Sun Zhenan Tan Tieniu

概要

異種顔認識(Heterogeneous Face Recognition, HFR)は、法医学、セキュリティ、商業分野などにおいて重要な応用を持つ、異なる感応モダリティ(センシングモード)で取得された顔画像を照合することを目的としている。しかし、異種顔画像間には大きなクラス内変動が存在し、異モダリティ間顔画像ペアのトレーニングサンプルが限られているため、従来の顔認識よりもはるかに困難な問題である。本論文では、近赤外線(NIR)と可視光(VIS)顔画像間の不変特徴を学習するための新規アプローチ、すなわちワッサーシュタインCNN(Wasserstein CNN、略してWCNN)を提案する。WCNNの低レベル層は、広く利用可能な可視スペクトル顔画像を用いて学習される。高レベル層は、NIR層、VIS層、およびNIR-VIS共有層の3つの部分に分割される。前二者はモダリティ固有の特徴を学習することを目的とし、NIR-VIS共有層はモダリティ不変特徴部分空間を学習することを設計している。ワッサーシュタイン距離をNIR-VIS共有層に導入し、異種特徴分布間の不一致を測定する。これにより、WCNNの学習は、NIR分布とVIS分布間のワッサーシュタイン距離を最小化することで、異種顔画像に対する不変な深層特徴表現を実現することを目指す。小規模な異種顔データセットにおける過剰適合(over-fitting)を回避するため、WCNNの全結合層に相関事前情報(correlation prior)を導入し、パラメータ空間を削減する。この事前情報は、エンドツーエンドネットワーク内で低ランク制約として実装される。この統合的な定式化により、トレーニング段階では深層特徴表現の逐次最小化が可能となり、テスト段階では異種データに対する効率的な計算が実現される。3つの挑戦的なNIR-VIS顔認識データベースを用いた広範な実験により、ワッサーシュタインCNNが最先端手法に対して顕著な優位性を示した。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています