CATENA : Extraction de relations causales et temporelles à partir de textes en langage naturel

Nous présentons CATENA, un système basé sur des tamis (sieves) pour extraire et classifier les relations temporelles et causales à partir de textes en anglais, en exploitant l’interaction entre les modèles temporel et causal. Nous évaluons les performances de chaque tamis, en montrant que les composants basés sur des règles, appris automatiquement et fondés sur le raisonnement contribuent tous trois à atteindre des résultats de pointe sur les jeux de données TempEval-3 et TimeBank-Dense. Bien que les relations causales soient nettement plus rares que les relations temporelles, l’architecture proposée ainsi que les caractéristiques sélectionnées s’avèrent globalement adaptées à la fois à ces deux tâches. Les effets de l’interaction entre les composants temporels et causaux, bien que limités, produisent des résultats prometteurs et confirment le lien étroit existant entre les dimensions temporelle et causale des textes.