17日前
PropagationNet:点を曲線に伝播させることで構造情報学習
Xiehe Huang, Weihong Deng, Haifeng Shen, Xiubao Zhang, Jieping Ye

要約
深層学習技術の進展により、顔アライメントアルゴリズムの性能は著しく向上した。しかし、実環境下における顔アライメント問題は、頭部の姿勢の多様性やサンプル不足といった課題に起因し、依然として大きな課題のままである。具体的には、顕著な表情変化、極端な頭部姿勢、不均一な照明条件など、制約のない状況下でのアライメントは依然として解決されていない。本論文では、この問題に対処するための我々の2つの提案——「伝播モジュール(Propagation Module)」と「フォーカルウイング損失(Focal Wing Loss)」——の背後にある直感的根拠と理論的妥当性を検討する。具体的には、ランドマークのヒートマップを境界ヒートマップへと伝播させるという新たな構造を導入した、ヒートマップ回帰に基づく顔アライメント手法を提案する。この手法により、境界ヒートマップが追加の構造情報を提供し、その後の注目マップ(attention map)の生成に寄与する。さらに、実環境下における困難なサンプルを効果的に抽出・強調するため、フォーカルウイング損失を提案する。また、CNNのシフト不変性(shift-variance)問題を克服するため、他分野で用いられているCoordConvやAnti-aliased CNNといった手法を導入する。異なるベンチマーク(WFLW、300W、COFW)において広範な実験を実施した結果、本手法は既存の最先端手法を大きく上回る性能を達成した。特に、WFLWでは平均誤差4.05%、300Wフルセットでは2.93%、COFWでは3.71%の平均誤差を達成し、顔アライメントの精度向上に寄与する有効なアプローチであることが示された。