2ヶ月前
動的な注意制御を用いた形状回帰の連鎖と、訓練データ拡張およびファジ集合に基づくサンプル重み付けの活用
Zhen-Hua Feng; Josef Kittler; William Christmas; Patrik Huber; Xiao-Jun Wu

要約
私たちは、制約のない顔画像に対する堅牢な顔のランドマーク検出を実現する新しいカスケード形状回帰(CSR)アーキテクチャ、すなわち動的注意制御型CSR(Dynamic Attention-Controlled CSR: DAC-CSR)を提案します。私たちのDAC-CSRは、顔のランドマーク検出を3つの段階的なサブタスクに分割します:顔領域の微調整、一般的なCSR、および注意制御型CSRです。最初の2つのステージでは、初期の顔領域を微調整し、中間的な顔のランドマークを出力します。その後、オンライン動的モデル選択手法を使用して、適切なドメイン固有のCSRを選択し、さらにランドマークの微調整を行います。私たちのDAC-CSRにおける主要な革新点は、故障耐性メカニズムであり、このメカニズムは注意制御型ドメイン固有モデルの学習においてファジィ集合サンプル重み付けを使用しています。さらに、単純ながら効果的な2Dプロファイル顔ジェネレータによるデータ拡張と、コンテキストに応じた特徴量抽出を提唱しており、これらによりより良い顔特徴表現が可能となります。困難なデータセット上で得られた実験結果は、私たちのDAC-CSRが最先端技術に対して優れていることを示しています。