HyperAIHyperAI
il y a 16 jours

FSA-Net : Apprentissage de l’agrégation de structures à granularité fine pour l’estimation de l’orientation de la tête à partir d’une seule image

{ Yung-Yu Chuang, Yen-Yu Lin, Yi-Ting Chen, Tsun-Yi Yang}
FSA-Net : Apprentissage de l’agrégation de structures à granularité fine pour l’estimation de l’orientation de la tête à partir d’une seule image
Résumé

Cet article propose une méthode d’estimation de l’orientation de la tête à partir d’une seule image. Les approches antérieures prédisent souvent l’orientation de la tête à l’aide de la détection de points caractéristiques ou de l’estimation de profondeur, ce qui entraîne une charge computationnelle plus élevée qu’ nécessaire. Notre méthode repose sur une régression combinée à une agrégation de caractéristiques. Pour obtenir un modèle compact, nous utilisons un schéma de régression stagiaire douce. Les méthodes existantes d’agrégation de caractéristiques traitent les entrées comme un ensemble de caractéristiques, ignorant ainsi les relations spatiales présentes dans la carte de caractéristiques. Nous proposons d’apprendre une cartographie structurée fine pour regrouper spatialement les caractéristiques avant leur agrégation. Cette structure fine fournit des informations partielles ainsi que des valeurs agrégées. En exploitant des poids d’importance apprenables et non apprenables selon la position spatiale, différentes variantes de modèle peuvent être générées, formant ainsi un ensemble complémentaire. Les expériences montrent que notre méthode surpasser les états de l’art, tant dans les approches sans points caractéristiques que dans celles basées sur les points caractéristiques ou l’estimation de profondeur. Avec une seule image RGB en entrée, notre méthode obtient même de meilleurs résultats que des méthodes utilisant des données multimodales (RGB-D, RGB-temps) pour l’estimation de l’angle de tangage (yaw). En outre, la surcharge mémoire de notre modèle est 100 fois inférieure à celle des méthodes antérieures.

FSA-Net : Apprentissage de l’agrégation de structures à granularité fine pour l’estimation de l’orientation de la tête à partir d’une seule image | Articles de recherche récents | HyperAI