2ヶ月前

姿勢不変の顔合わせに単一CNNを使用

Amin Jourabloo; Mao Ye; Xiaoming Liu; Liu Ren
姿勢不変の顔合わせに単一CNNを使用
要約

顔のアライメントは過去10年間で大幅な進歩を遂げています。最近の焦点の一つは、大規模な頭部ポーズを持つ顔画像に密集した3次元顔形状をアライメントすることです。この分野で主流となっている技術は、CNNなどの回帰器のカスケードに基づいており、有望な結果を示しています。しかし、CNNのカスケードにはいくつかの課題があります。例えば、エンドツーエンドでの学習が困難であること、手作業で設計された特徴量を使用していること、および学習速度が遅いことが挙げられます。これらの問題に対処するため、私たちは新しい層である可視化層(visualization layer)を提案します。この層はCNNアーキテクチャに統合され、異なる損失関数との共同最適化を可能にします。提案手法は複数のデータセット上で広範囲に評価され、最先端の精度を達成しながら、典型的なCNNカスケードと比較して学習時間を半分以下に削減することが確認されました。さらに、可視化層を使用した複数のCNNアーキテクチャについて比較検討を行い、その利用による優位性をより明確に示しました。

姿勢不変の顔合わせに単一CNNを使用 | 最新論文 | HyperAI超神経