Apprentissage contrastif sensible au sujet pour la synthèse abstraite de dialogues

Contrairement au texte bien structuré, tel que les rapports d'actualité ou les articles d'encyclopédie, le contenu des dialogues provient souvent de deux ou plusieurs interlocuteurs échangeant des informations mutuellement. Dans un tel contexte, le sujet d'une conversation peut évoluer au fil de son déroulement, et les informations clés relatives à un sujet donné sont fréquemment réparties sur plusieurs énoncés émis par différents interlocuteurs, ce qui pose des défis importants pour la synthèse abstraite des dialogues. Afin de capturer efficacement les divers sujets d'une conversation et d'extraire les faits saillants associés à ces sujets, ce travail propose deux objectifs d'apprentissage contrastif sensibles au sujet : la détection de cohérence et la génération de sous-résumés. Ces objectifs sont conçus pour modéliser implicitement les changements de sujet et surmonter les difficultés liées à la dispersion de l'information dans le cadre de la synthèse de dialogues. Les objectifs contrastifs proposés sont formulés comme des tâches auxiliaires associées à la tâche principale de synthèse de dialogues, et sont intégrés à travers une stratégie d'actualisation alternée des paramètres. Des expériences étendues sur des jeux de données standard montrent que la méthode proposée, simple mais efficace, surpasser de manière significative les modèles de référence performants et atteint un nouveau record d'état de l'art. Le code source et les modèles entraînés sont disponibles publiquement à l'adresse suivante : \href{https://github.com/Junpliu/ConDigSum}{https://github.com/Junpliu/ConDigSum}.