2ヶ月前
スタックされた Dense U-Net とデュアルトランスフォーマーを用いた堅牢な顔面アライメント
Jia Guo; Jiankang Deng; Niannan Xue; Stefanos Zafeiriou

要約
野生環境下撮影された画像における顔のランドマーク位置特定は、重要な課題であり、同時に非常に困難な問題です。現在の最先端技術は、スタック型 U-Net やアワーガラスネットワークなどの特定の種類の深層畳み込みニューラルネットワーク(DCNN)を中心に展開されています。本研究では、この課題に対して革新的にスタック型 Dense U-Net を提案します。モデルの性能を向上させつつ、計算量やモデルサイズを犠牲にしない新たなスケール集約ネットワーク構造とチャネル集約ブロックを設計しました。スタック型 Dense U-Net 内での変形畳み込み(deformable convolutions)と外部データ変換用の一貫性損失(coherent loss)の支援により、当モデルは任意の入力顔画像に対する空間的な不変性を得ました。多くの野生環境データセットを用いた広範な実験により、極端な姿勢、誇張された表情、および重度の遮蔽下でも提案手法の堅牢性が確認されました。最後に、正確な3次元顔合わせが姿勢不変性顔認識への貢献を示し、CFP-FP データセットにおいて新しい最先端精度を達成したことを示しています。