要約
顔のアライメントに対して、非常に効率的かつ高精度な「明示的形状回帰(Explicit Shape Regression)」手法を提案する。従来の回帰ベースのアプローチとは異なり、本手法は画像から顔の全体形状(顔のランドマーク集合)を直接推定するベクトル値回帰関数を学習し、訓練データ上でアライメント誤差を明示的に最小化する。形状の内在的な制約は、カスケード学習フレームワーク内で自然に回帰器に組み込まれ、テスト時には粗い段階から細かい段階へと段階的に適用される。これにより、多数の従来手法で用いられる固定パラメトリック形状モデルを必要としない。回帰の効果と効率をさらに高めるために、二段階ブースティング回帰、形状インデックス特徴、および相関に基づく特徴選択法を新たに設計した。この組み合わせにより、大規模な訓練データから短時間(2,000枚の画像で20分)に高精度なモデルを学習可能であり、テスト時には極めて高速な推論が実現可能(87個のランドマーク形状に対して15ms)である。困難なデータセット上での実験により、本手法が精度および効率の両面で、現在の最先端技術を顕著に上回ることを確認した。