Command Palette
Search for a command to run...
Régression de Forme en Cascade Contrôlée par l'Attention Dynamique Exploitant l'Augmentation des Données d'Entraînement et le Ponderation des Échantillons par les Ensembles Flous
Régression de Forme en Cascade Contrôlée par l'Attention Dynamique Exploitant l'Augmentation des Données d'Entraînement et le Ponderation des Échantillons par les Ensembles Flous
Zhen-Hua Feng; Josef Kittler; William Christmas; Patrik Huber; Xiao-Jun Wu
Résumé
Nous présentons une nouvelle architecture de régression en cascade de forme (Cascaded Shape Regression, CSR), nommée CSR à l'attention dynamique contrôlée (Dynamic Attention-Controlled CSR, DAC-CSR), pour la détection robuste des points d'intérêt faciaux sur des visages non contraints. Notre DAC-CSR divise la détection des points d'intérêt faciaux en trois sous-tâches en cascade : le raffinement de la boîte englobante du visage, la régression en cascade de forme générale (CSR) et la régression en cascade de forme à l'attention contrôlée (attention-controlled CSR). Les deux premières étapes affinent les boîtes englobantes initiales du visage et produisent des points d'intérêt faciaux intermédiaires. Ensuite, une méthode de sélection dynamique de modèles en ligne est utilisée pour choisir les CSRs spécifiques au domaine appropriés afin de raffiner davantage les points d'intérêt. L'innovation clé de notre DAC-CSR est le mécanisme tolérant aux pannes, qui utilise un pondération d'échantillons basée sur les ensembles flous pour l'entraînement des modèles spécifiques au domaine à l'attention contrôlée. De plus, nous prônons l'augmentation des données avec un générateur simple mais efficace de profils faciaux 2D, ainsi qu'une extraction de caractéristiques contextuelle pour une meilleure représentation des caractéristiques faciales. Les résultats expérimentaux obtenus sur des jeux de données difficiles démontrent les avantages de notre DAC-CSR par rapport à l'état de l'art.