19日前
HIH:ヒートマップにおけるヒートマップを活用したより正確な顔アライメントのためのアプローチ
Xing Lan, Qinghao Hu, Qiang Chen, Jian Xue, Jian Cheng

要約
ヒートマップベースの回帰は、直接座標回帰における空間的および文脈的情報の欠如を克服し、顔のアライメントというタスクを革命的に変革した。しかし、画像リサイズやネットワークのダウンサンプリングにおいてサブピクセル座標を無視するため、量子化誤差に悩まされている。本論文では、まずベンチマーク上で量子化誤差を定量的に分析し、最先端手法における全体の予測誤差の3分の1以上を占めることを明らかにした。この問題に対処するため、従来の時計型ネットワーク(hourglass network)にシームレスに統合可能な新しい「ヒートマップ内ヒートマップ(Heatmap In Heatmap, HIH)」表現と、座標ソフト分類(Coordinate Soft-Classification, CSC)手法を提案する。HIH表現では、ネストされたヒートマップを用いて座標ラベルを統合的に表現する:整数座標を表す「整数ヒートマップ」と、サブピクセル座標を表す「小数ヒートマップ」の2種類を用いる。小数ヒートマップの範囲は、対応する整数ヒートマップにおける1ピクセルに相当する。さらに、オフセット回帰問題を区間分類タスクに転換し、CSCはピクセルの信頼度をその区間の確率として扱う。同時に、CSCはガウス分布関数から生成されるソフトラベルを用いた分布損失(distribution loss)を導入することで、座標オフセットの分布をより効果的に学習可能にする。困難なベンチマークデータセットにおける広範な実験により、本手法のHIHが最先端の性能を達成することを実証した。特に、WFLWデータセットでは4.08 NME(正規化平均誤差)、COFWデータセットでは3.21 NMEを達成し、従来手法を顕著に上回った。