
要約
本稿では、顔のアライメントに向けた高速かつ高精度な座標回帰手法を提案する。既存の多くの中の顔ランドマーク回帰手法は、特徴マップをランドマーク座標に変換する際に、通常、全結合層(fully connected layers)を用いている。一方、本研究では、顔のランドマーク間の関係性を明示的に考慮する構造的整合性(structure coherence)コンポーネントを導入する。人間の顔には幾何学的な構造が存在するため、顔の異なる部位間の構造的整合性は、ランドマークの正確な局所化に重要な手がかりを提供する。しかし、全結合層における密接な接続構造は、このような整合性を過剰に利用し、重要度の高い情報が他のすべての接続に埋もれてしまうという問題がある。これに対して、本手法では、最も関連性の高いランドマーク間で特徴を伝達する動的スパースグラフ構造を活用することで、効果的に構造的整合性を捉える。さらに、精度を向上させるために、新規の目的関数である「Soft Wing損失(Soft Wing loss)」を提案する。WFLW、COFW、300Wの3つの代表的なベンチマークデータセットにおける広範な実験により、提案手法の有効性が実証され、高速な処理速度と最先端の性能を達成した。特に、困難な状況下でも高いロバスト性を示し、COFWおよびWFLWデータセットにおいて、それぞれ0%および2.88%という非常に低い失敗率を達成した。