Analyse conversationnelle à l'aide de réseaux neuronaux récurrents bidirectionnels basés sur l'attention au niveau des énoncés

Les approches récentes pour la reconnaissance des actes de dialogue ont montré que le contexte des énoncés précédents est important pour classifier l'énoncé suivant. Il a été démontré que les performances s'améliorent rapidement lorsque le contexte est pris en compte. Nous proposons un modèle de réseau neuronal récurrent bidirectionnel basé sur l'attention au niveau des énoncés (Utt-Att-BiRNN) pour analyser l'importance des énoncés précédents dans la classification de l'énoncé courant. Dans notre configuration, le BiRNN reçoit en entrée l'ensemble des énoncés courants et précédents. Notre modèle surpasse les modèles antérieurs qui utilisent uniquement les énoncés précédents comme contexte sur le corpus utilisé. Une autre contribution de cet article est de découvrir la quantité d'information contenue dans chaque énoncé pour classifier l'énoncé suivant, et de montrer que l'apprentissage basé sur le contexte non seulement améliore les performances, mais atteint également une plus grande confiance dans la classification. Nous utilisons des caractéristiques au niveau des caractères et des mots pour représenter les énoncés. Les résultats sont présentés pour les représentations au niveau des caractères et des mots, ainsi que pour un modèle d'ensemble combinant ces deux représentations. Nous avons constaté que lors de la classification d'énoncés courts, les énoncés précédents les plus proches contribuent dans une mesure plus importante.