Command Palette
Search for a command to run...
正確な3次元顔面ランドマーク定位のための同時ボクセルおよび座標回帰
正確な3次元顔面ランドマーク定位のための同時ボクセルおよび座標回帰
Zhang Hongwen Li Qi Sun Zhenan
概要
3D顔面形状は2D形状に比べて表現力が高く、視点不変性にも優れる。しかし、3D透視投影下における特徴点の曖昧性から、単一画像内での3D顔面特徴点の位置推定は困難である。従来の手法は、2D特徴点の位置推定と深度推定を段階的に行う非最適な2段階戦略を採用している。本論文では、3D顔面特徴点の位置推定をエンドツーエンドでより効果的に実現するため、Joint Voxel and Coordinate Regression(JVCR)手法を提案する。まず、各ボクセルが3D特徴点の位置である確率を効率的に表現するコンパクトな体積表現を提案する。この表現の次元数は目標特徴点数に依存しないため、次元の呪いを回避できる。次に、粗いスケールから細かいスケールへと段階的に体積表現を推定するスタック型アワークラスネットワークを採用し、その後、推定された体積を入力として受け取り、顔形状の3D座標を回帰する3D畳み込みネットワークを用いる。これにより、ニューラルネットワークが特徴点間の3D構造的制約をより効率的に学習可能となる。さらに、提案するパイプラインはエンドツーエンド学習を可能にし、3D顔面特徴点推定のロバスト性と精度を向上させる。本手法の有効性は、3DFAWおよびAFLW2000-3Dデータセット上で検証された。実験結果から、既存手法と比較して本手法が最先端の性能を達成することが示された。