Inférence contextuelle multivue du sens commun : Un nouveau jeu de données et une nouvelle tâche

L'inférence contextuelle de bon sens est la tâche de générer divers types d'explications autour des événements dans un dialogue dyadique, y compris les causes, les motivations, les réactions émotionnelles et autres. La production d'une explication cohérente et non triviale nécessite une prise de conscience de la structure du dialogue et de la manière dont un événement est ancré dans le contexte. Dans ce travail, nous créons CICEROv2, un jeu de données composé de 8 351 instances provenant de 2 379 dialogues, contenant plusieurs réponses écrites par des humains pour chaque question d'inférence contextuelle de bon sens, représentant un type d'explication sur la cause, l'événement ultérieur, la motivation et la réaction émotionnelle. Nous montrons que les inférences dans CICEROv2 sont plus sémantiquement diverses que celles d'autres jeux de données d'inférence contextuelle de bon sens. Pour résoudre cette tâche d'inférence, nous proposons une collection d'objectifs pré-entraînement, incluant le débruitage des concepts et le tri des interventions (utterance sorting), afin de préparer un modèle pré-entraîné pour la tâche d'inférence contextuelle de bon sens en aval. Nos résultats montrent que les objectifs pré-entraînement proposés sont efficaces pour adapter le modèle T5-Large pré-entraîné à la tâche d'inférence contextuelle de bon sens.