Ordre d’événements denses avec une architecture à plusieurs passes

Les dix dernières années de recherche sur le classement des événements se sont concentrées sur l’apprentissage de relations partielles entre événements documentaires et expressions temporelles. Le corpus le plus populaire, TimeBank, ne contient qu’un sous-ensemble restreint du graphe d’ordre possible. La plupart des évaluations suivent cette approche en ne testant que certaines paires d’événements (par exemple, uniquement les verbes principaux de phrases voisines). Cela a conduit la majorité des travaux à se focaliser sur des modèles spécialisés pour des étiquetages partiels. Ce papier vise à recentrer la discussion, passant de l’identification de certaines relations à celle de toutes les relations possibles. Nous présentons de nouvelles expériences sur des graphes d’événements fortement connexes, contenant environ dix fois plus de relations par document que TimeBank. Nous décrivons également un changement de paradigme, passant d’un modèle unique à une architecture en « tamis » (sieve-based) qui intègre naturellement plusieurs modèles dans une cascade classée par précision. Chaque tamis ajoute des étiquettes au graphe d’événements une par une, et les tamis antérieurs fournissent des informations aux suivants via la fermeture transitive. Ce travail introduit donc des innovations à la fois au niveau de l’approche et de la tâche. Nous menons des expérimentations sur les graphes d’événements les plus denses jamais étudiés à ce jour, et démontrons une amélioration de 14 % par rapport aux méthodes de pointe.