16日前
LUVLi フェースアライメント:ランドマーク位置、不確実性、可視性確率の推定
Abhinav Kumar, Tim K. Marks, Wenxuan Mou, Ye Wang, Michael Jones, Anoop Cherian, Toshiaki Koike-Akino, Xiaoming Liu, Chen Feng

要約
現代の顔アライメント手法は、顔のランドマーク位置を非常に正確に予測できるようになったが、通常は予測位置の不確実性を推定せず、またランドマークの可視性(可視か否か)を予測することも少ない。本論文では、ランドマーク位置、それらの予測位置に関連する不確実性、およびランドマークの可視性を同時に予測する新たなフレームワークを提案する。これらの情報を混合確率変数としてモデル化し、我々が提案する「位置・不確実性・可視性尤度(Location, Uncertainty, and Visibility Likelihood: LUVLi)」損失関数を用いて訓練された深層ネットワークにより推定を行う。さらに、頭部姿勢の範囲が広い19,000枚以上の顔画像を含む大規模な顔アライメントデータセットについて、完全に新しいラベル付けを公開する。各顔画像は68個のランドマークの真値位置を手動でラベル付けしており、さらに各ランドマークが遮蔽されていない(非遮蔽)、自遮蔽(極端な頭部姿勢による)、外部遮蔽(他の物体による)のいずれに該当するかという追加情報を含んでいる。本手法による同時推定は、予測されたランドマーク位置の不確実性について高精度な推定を可能にするだけでなく、複数の標準的な顔アライメントデータセットにおいて、ランドマーク位置の予測精度も最先端水準を達成している。本手法が得る予測位置の不確実性推定は、顔アライメントが失敗する入力画像を自動的に識別する用途に活用でき、後続のタスクにおいて極めて重要な役割を果たす可能性がある。