Prédiction auto- et pseudo-auto-supervisée du locuteur et de l'énoncé clé pour la compréhension de dialogue à plusieurs participants

La lecture de compréhension de texte (MRC) à dialogue multi-participants pose un défi considérable, en raison de la présence de plusieurs intervenants au sein d’un même échange, entraînant des flux d’information complexes liés aux locuteurs ainsi que des contextes dialogiques bruyants. Pour atténuer ces difficultés, les modèles précédents se sont concentrés sur la manière d’intégrer ces informations à l’aide de modules basés sur des graphes complexes et de données supplémentaires étiquetées manuellement, souvent rares dans les scénarios réels. Dans cet article, nous proposons deux tâches de prédiction auto-supervisées et pseudo-auto-supervisées, sans nécessiter d’effort humain, pour modéliser implicitement les flux d’information des locuteurs et capturer les indices saillants au sein d’un dialogue long. Les résultats expérimentaux sur deux jeux de données de référence démontrent l’efficacité de notre méthode par rapport aux modèles de référence et aux approches les plus avancées actuelles.