Extraction ou Devinettes ? Amélioration de la Fidélité de l’Extraction des Relations Temporelles entre Événements

Dans cet article, nous visons à améliorer la fidélité des modèles d'extraction de relations temporelles (TempRel) sous deux angles. Le premier angle consiste à extraire les informations de manière véritablement contextuelle. Pour y parvenir, nous proposons de réaliser une analyse contre-factuelle afin d'atténuer les effets de deux types importants de biais lors de l'entraînement : le biais du déclencheur d'événements et le biais des étiquettes fréquentes. Nous intégrons également des informations sur le temps verbal dans les représentations des événements pour mettre explicitement l'accent sur la description contextuelle. Le deuxième angle est de fournir une estimation appropriée de l'incertitude et de s'abstenir d'extraire lorsque aucune relation n'est décrite dans le texte. En paramétrant une loi a priori Dirichlet sur la distribution catégorielle prédite par le modèle, nous améliorons les estimations du modèle concernant la probabilité de justesse et rendons les prédictions TempRel plus sélectives. Nous utilisons également un recalage par température pour réajuster la mesure de confiance du modèle après l'atténuation des biais. Par une analyse expérimentale sur MATRES, MATRES-DS et TDDiscourse, nous montrons que notre modèle extrait les relations temporelles et les chronologies avec plus de fidélité par rapport aux méthodes de pointe (SOTA), en particulier en cas de décalages distributionnels.