4ヶ月前

3Dポーズの解明:制約のない2D顔アライメントのための樹状CNNにおけるアプローチ

Amit Kumar; Rama Chellappa
3Dポーズの解明:制約のない2D顔アライメントのための樹状CNNにおけるアプローチ
要約

ヒートマップ回帰は、ランドマークの位置特定に長年使用されてきました。多くの手法では、ヒートマップ分類段階で非常に深いボトルネックモジュールのスタックを使用し、その後ヒートマップ回帰によってキーポイントを抽出します。本論文では、単一の樹状CNN(Pose Conditioned Dendritic Convolutional Neural Network: PCD-CNN)を提案します。このネットワークでは、分類ネットワークの後に、モジュラーな第二の分類ネットワークが続き、エンドツーエンドで訓練することで正確なランドマーク点を得ることができます。ベイジアンフォーミュレーションに従い、顔画像の3次元ポーズを明示的に解離し、ランドマーク推定をポーズに条件付けます。これにより多目的アプローチとは異なります。広範な実験結果から、ポーズに条件付けすることで顔ポーズに対する無関心性が向上し、位置特定誤差が減少することが示されています。提案されたモデルは、ランドマーク点の数を可変にすることができ、他のデータセットへの適用範囲が広がります。ネットワークの深さや幅を増やす代わりに、Mask-Softmax Lossと難易度の高いサンプルマイニングを使用して効率的にCNNを訓練し、AFLW, AFW, COFW, IBUGなどの課題のあるデータセットからの極端なおよび中程度のポーズを持つ顔画像に対して最新手法よりも最大15%の誤差削減を達成しました。

3Dポーズの解明:制約のない2D顔アライメントのための樹状CNNにおけるアプローチ | 論文 | HyperAI超神経