2ヶ月前
形状を保った顔のランドマーク生成にグラフアテンションネットワークを使用する
Prados-Torreblanca, Andrés ; Buenaposada, José M. ; Baumela, Luis

要約
最優秀なランドマーク推定アルゴリズムは、大規模な畳み込みニューラルネットワーク(CNN)が局所的な外観を表現する優れた能力を利用することに基づいています。しかし、これらのアルゴリズムが学習できる空間的な関係は弱いことが広く知られています。この問題に対処するために、CNNとグラフアテンションネットワーク回帰器のカスケードを組み合わせたモデルを提案します。そのため、顔のランドマークの外観と位置を同時に表現する符号化方法と、情報の信頼性に応じて重み付けを行うアテンションメカニズムを導入しました。これに加えて、グラフノードの位置初期化のためにマルチタスクアプローチを使用し、粗いレベルから細かいレベルへと段階的にランドマークを記述するスキームも採用しています。実験結果は、提案したモデルが顔の構造の全体的な表現を学習し、頭部姿勢やランドマーク推定に関する人気ベンチマークで最上位の性能を達成することを確認しています。特に、ランドマークの局所的な外観に大きな変化がある状況において、当モデルによる改善は最も顕著です。