HyperAIHyperAI

Command Palette

Search for a command to run...

形状を保った顔のランドマーク生成にグラフアテンションネットワークを使用する

Andrés Prados-Torreblanca José M. Buenaposada Luis Baumela

概要

最優秀なランドマーク推定アルゴリズムは、大規模な畳み込みニューラルネットワーク(CNN)が局所的な外観を表現する優れた能力を利用することに基づいています。しかし、これらのアルゴリズムが学習できる空間的な関係は弱いことが広く知られています。この問題に対処するために、CNNとグラフアテンションネットワーク回帰器のカスケードを組み合わせたモデルを提案します。そのため、顔のランドマークの外観と位置を同時に表現する符号化方法と、情報の信頼性に応じて重み付けを行うアテンションメカニズムを導入しました。これに加えて、グラフノードの位置初期化のためにマルチタスクアプローチを使用し、粗いレベルから細かいレベルへと段階的にランドマークを記述するスキームも採用しています。実験結果は、提案したモデルが顔の構造の全体的な表現を学習し、頭部姿勢やランドマーク推定に関する人気ベンチマークで最上位の性能を達成することを確認しています。特に、ランドマークの局所的な外観に大きな変化がある状況において、当モデルによる改善は最も顕著です。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
形状を保った顔のランドマーク生成にグラフアテンションネットワークを使用する | 記事 | HyperAI超神経