LSA-T : Le premier ensemble de données continu en langue des signes argentine pour la traduction de la langue des signes

La traduction de la langue des signes (TLS) est un domaine de recherche actif qui englobe l’interaction homme-machine, la vision par ordinateur, le traitement du langage naturel et l’apprentissage automatique. Les progrès réalisés dans ce domaine pourraient permettre une meilleure intégration des personnes sourdes. Ce papier présente, à notre connaissance, le premier jeu de données continu en langue des signes argentine (LSA). Il comprend 14 880 vidéos au niveau des phrases issues de la chaîne YouTube CN Sordos, munies d’étiquettes et d’annotations de points clés pour chaque signeur. Nous proposons également une méthode pour identifier le signeur actif, une analyse détaillée des caractéristiques du jeu de données, un outil de visualisation permettant d’explorer les données, ainsi qu’un modèle neuronal de TLS servant de référence pour des expériences futures.