
要約
深層ニューラルネットワークは顔のアライメント問題において合理的な精度を達成していますが、特に顔画像が遮蔽や極端な頭部姿勢を含む場合、依然として課題が多い領域です。顔アライメントに主に使用される方法には、ヒートマップベースの回帰(HBR)と座標ベースの回帰(CBR)があります。CBR方法は計算機メモリをより少ない量で必要としますが、その性能はHBR方法よりも劣ります。本論文では、顔アライメントの精度向上のために適応型座標ベースの回帰(ACR)損失関数を提案します。アクティブ形状モデル(ASM)から着想を得て、変動が真のランドマーク点よりも少ない一連の顔ランドマーク点からなるスムーズフェイスオブジェクトを生成しました。次に、真のランドマーク点の分布と対応するスムーズフェイスオブジェクトとの比較により、ネットワークが各ランドマーク点を予測する難易度を推定する方法を導入しました。提案したACR損失関数は、各顔ランドマーク点の予測難易度に基づいてその曲率と損失の影響力を適応的に調整できます。これにより、ACR損失関数はネットワークを容易なポイントよりも難しいポイントへと誘導し、顔アライメントタスクの精度向上に寄与します。我々の広範な評価結果は、様々な顔画像における顔ランドマーク点の予測能力について提案したACR損失関数の有効性を示しています。