Active Speaker Localization
La localisation spatiale du locuteur actif (LSLA) est le processus de détermination de la position d'un locuteur actif dans un environnement en utilisant l'audio, la vidéo ou une combinaison de ces deux modalités. Son objectif est d'identifier précisément l'emplacement du locuteur pour améliorer les performances des systèmes d'interaction multimodale. La LSLA présente une valeur d'application importante dans des domaines tels que les systèmes de conférence, la surveillance intelligente et l'interaction homme-machine, capable d'optimiser les capacités perceptuelles des systèmes et l'expérience utilisateur.