2ヶ月前

Sparse Local Patch Transformer による堅牢な顔位置合わせとランドマークの内在関係学習

Jiahao Xia; Weiwei qu; Wenjian Huang; Jianguo Zhang; Xi Wang; Min Xu
Sparse Local Patch Transformer による堅牢な顔位置合わせとランドマークの内在関係学習
要約

近年、ヒートマップ回帰手法が顔のアライメント分野で主流となっていますが、異なるランドマーク間の内在的な関係を無視しています。本論文では、これらの内在的な関係を学習するためのスパースローカルパッチトランスフォーマー(Sparse Local Patch Transformer: SLPT)を提案します。SLPTは、各単一のランドマークから局所パッチの表現を生成し、注意メカニズムに基づく適応的な内在的関係によってそれらを集約します。各ランドマークのサブピクセル座標は、集約された特徴量に基づいて独立して予測されます。さらに、粗い段階から細かい段階へと進むフレームワークが導入され、これにより初期のランドマークが動的にリサイズされた局所パッチからの細かい特徴量を使用して徐々に目標となる顔のランドマークに収束することが可能になります。WFLW、300W、COFWを含む3つの主要ベンチマークでの広範な実験結果は、提案手法が顔のランドマーク間の内在的関係を学習することで、計算複雑度を大幅に削減しつつ最先端レベルの性能を達成していることを示しています。コードはプロジェクトウェブサイトで公開されています。

Sparse Local Patch Transformer による堅牢な顔位置合わせとランドマークの内在関係学習 | 最新論文 | HyperAI超神経