18日前
エンドツーエンド顔アライメントのための直接形状回帰ネットワーク
{Xian-Tong Zhen, Xianglong Liu, Heng Huang, Xin Miao, Vassilis Athitsos, Cheng Deng}

要約
顔のアライメントは、顔認識における基盤的な役割を果たすため、コンピュータビジョン分野で広く研究されてきたが、依然として解決されていない課題である。主な困難は、顔画像と対応する顔の形状との間にある極めて非線形な関係にあり、この関係は特徴点間の潜在的な相関性と密接に結びついている。従来の手法は主にカスケード回帰に依存しており、初期化への強い依存性や特徴点間の相関を十分に活用できないといった内在的な欠点を抱えている。本論文では、上記の課題を統一的な枠組みで同時に取り扱うことで、エンドツーエンドの顔アライメントを実現するため、直接形状回帰ネットワーク(DSRN: Direct Shape Regression Network)を提案する。具体的には、二重畳み込み層を導入し、本論文で提案するフーリエ特徴プーリング層を用いることで、画像と形状の間の強い非線形関係を効率的に解消する強力な表現を構築する。また、低ランク学習を用いた線形層を組み込むことで、特徴点間の相関関係を効果的に符号化し、性能向上を実現する。DSRNは、非線形特徴抽出に適したカーネルの利点と、構造化予測に強みを持つニューラルネットワークの長所を活かし、顔アライメントのための初めてのエンドツーエンド学習アーキテクチャを提供する。その有効性と汎用性は、AFLW、300W、CelebA、MAFL、300VWの5つのベンチマークデータセットを用いた広範な実験によって検証された。すべての実験結果から、DSRNが一貫して高い性能を発揮し、多くの場合、最先端手法を上回ることを示した。