1ヶ月前

多列ネットワークを用いた顔認識

Weidi Xie; Andrew Zisserman
多列ネットワークを用いた顔認識
要約

本研究の目的は集合ベースの顔認識であり、すなわち2つの顔画像集合が同一人物かどうかを判定することである。従来では、集合全体の特徴記述子は集合内の個々の顔画像から得られる記述子の平均として計算されていた。本論文では、「視覚的」品質(解像度、照明)と「内容的」品質(識別分類における相対的重要性)に基づいて集約する神経ネットワークアーキテクチャを設計する。そのため、マルチコラムネットワーク(MN)を提案し、画像集合(集合内の画像数は可変)を入力として受け取り、全体の固定サイズの特徴記述子を学習して計算する。高品質な表現を促進するために、まず各個別の入力画像は自己品質評価モジュールによって「視覚的」品質で重み付けされ、その後、集合内の他の画像との「内容的」品質に基づいた動的な再調整が行われる。これらの両方の品質は、集合単位での分類のために訓練中に暗黙的に学習される。同じデータセット(VGGFace2)で訓練された既存の最先端アーキテクチャと比較して、我々のマルチコラムネットワークはIARPA IJB顔認識ベンチマークにおいて2-6%の改善を示し、これらのベンチマークにおけるすべての手法を超える性能を達成している。