Modélisation du tour de parole pour la classification des actes de dialogue

La classification des actes de dialogue (DA) consiste à catégoriser les énoncés selon la fonction qu’ils remplissent dans un échange conversationnel. Les approches existantes de classification DA modélisent les énoncés sans tenir compte des changements de tour de parole entre les interlocuteurs tout au long de la conversation, traitant ainsi le dialogue de la même manière que du texte écrit non interactif. Dans cet article, nous proposons d’intégrer les changements de tour de parole dans les conversations lors de la modélisation des DA. Plus précisément, nous apprenons des embeddings de tour de parole invariants par rapport à la conversation afin de représenter les tours de parole d’un interlocuteur dans une interaction ; ces embeddings appris sont ensuite combinés aux embeddings des énoncés pour la tâche ultérieure de classification DA. Grâce à ce mécanisme simple mais efficace, notre modèle parvient à capturer les significations présentes dans le contenu du dialogue tout en tenant compte des différents tours de parole des interlocuteurs. Une validation sur trois jeux de données publics standard démontre une performance supérieure de notre modèle.