HyperAIHyperAI
il y a 2 mois

Étiquetage de séquences d'actes de dialogue à l'aide d'un encodeur hiérarchique avec CRF

Harshit Kumar; Arvind Agarwal; Riddhiman Dasgupta; Sachindra Joshi; Arun Kumar
Étiquetage de séquences d'actes de dialogue à l'aide d'un encodeur hiérarchique avec CRF
Résumé

La reconnaissance des actes de dialogue associe des actes de dialogue (c'est-à-dire, des étiquettes sémantiques) aux énoncés dans une conversation. Le problème d'association d'étiquettes sémantiques aux énoncés peut être traité comme un problème d'étiquetage de séquence. Dans ce travail, nous construisons un réseau neuronal récurrent hiérarchique en utilisant des LSTM bidirectionnels comme unité de base et un champ aléatoire conditionnel (CRF) comme couche supérieure pour classer chaque énoncé dans son acte de dialogue correspondant. Le réseau hiérarchique apprend des représentations à plusieurs niveaux, à savoir le niveau mot, le niveau énoncé et le niveau conversation. Les représentations au niveau conversation sont utilisées en entrée de la couche CRF, qui prend en compte non seulement tous les énoncés précédents mais aussi leurs actes de dialogue, modélisant ainsi la dépendance entre les étiquettes et les énoncés, une considération importante dans le dialogue naturel. Nous validons notre approche sur deux ensembles de données de référence différents, Switchboard et Meeting Recorder Dialogue Act, et montrons une amélioration des performances par rapport aux méthodes de pointe existantes de 2,2 % et 4,1 % en points absolus, respectivement. Il est important de noter que l'accord inter-annotateurs sur l'ensemble de données Switchboard est de 84 %, et notre méthode est capable d'atteindre une précision d'environ 79 % malgré l'utilisation de données bruitées pour l'entraînement.

Étiquetage de séquences d'actes de dialogue à l'aide d'un encodeur hiérarchique avec CRF | Articles de recherche récents | HyperAI