Analyse de Discours par Dialogue Structuré

L'analyse du discours dialogique vise à révéler la structure interne d'une conversation impliquant plusieurs participants en identifiant tous les liens de discours et les relations correspondantes. Les travaux précédents traitent soit cette tâche comme une série de problèmes à choix multiples indépendants, où l'existence des liens et les relations sont décodées séparément, soit l'encodage est limité aux seules interactions locales, ignorant ainsi les informations structurales globales. En revanche, nous proposons une méthode fondée sur des principes qui améliore les travaux antérieurs sous deux angles : l'encodage et le décodage. Du côté de l'encodage, nous effectuons un encodage structuré sur la matrice d'adjacence suivie par l'algorithme d'apprentissage arborescent, où tous les liens de discours et les relations dans le dialogue sont optimisés conjointement sur la base d'une distribution latente au niveau arborescent. Du côté du décodage, nous effectuons une inférence structurée en utilisant l'algorithme modifié de Chiu-Liu-Edmonds, qui génère explicitement l'arbre couvrant non projectif à racines multiples étiqueté qui capture le mieux la structure du discours. De plus, contrairement aux travaux précédents, nous ne faisons pas appel à des caractéristiques conçues manuellement ; cela améliore la robustesse du modèle. Les expériences montrent que notre méthode atteint un nouveau niveau d'état de l'art, surpassant le modèle précédent de 2,3 points sur STAC et de 1,5 point sur Molweni (scores F1). \footnote{Le code est disponible à~\url{https://github.com/chijames/structured_dialogue_discourse_parsing}.}