Réseau de estimation de l’axe de regard guidé par un Agent par exploration de l’asymétrie à deux yeux
L’estimation du regard est une tâche essentielle pour comprendre l’attention visuelle humaine. Malgré les progrès récents apportés par le développement d’algorithmes, cette tâche reste difficile en raison de l’asymétrie d’apparence des deux yeux, causée par les variations d’orientation de la tête et l’éclairage non uniforme. Dans cet article, nous proposons une nouvelle architecture, le réseau AGE-Net (Agent-guided Gaze Estimation Network), permettant une utilisation optimale et efficace des caractéristiques des deux yeux. En exploitant l’asymétrie d’apparence et l’asymétrie correspondante dans l’espace des caractéristiques, nous avons conçu une branche principale ainsi que deux tâches de régression par agent. La branche principale extrait les caractéristiques pertinentes des yeux gauche et droit à partir de sémantiques de bas niveau. Parallèlement, les tâches de régression par agent extraient des caractéristiques asymétriques des deux yeux à partir de sémantiques de haut niveau, afin de guider la branche principale dans l’apprentissage d’un espace de caractéristiques oculaires plus riche. Les expérimentations montrent que notre méthode atteint des performances de pointe dans la tâche d’estimation du regard sur les jeux de données MPIIGaze et EyeDiap.