Des caractères aux intervalles temporels : de nouveaux paradigmes pour l’évaluation et l’analyse syntaxique neuronale de la normalisation temporelle

Cet article présente le premier modèle de normalisation temporelle entraîné sur le corpus SCATE. Dans le schéma SCATE, les expressions temporelles sont annotées comme une composition sémantique d'entités temporelles. Ce nouveau schéma favorise les approches d'apprentissage automatique, puisqu'il peut être considéré comme une tâche de parsing sémantique. Dans ce travail, nous proposons un réseau neuronal à sortie multiple basé sur les caractères, qui surpasser les états de l’art antérieurs fondés sur le schéma TimeML. Pour comparer les prédictions des systèmes suivant les deux schémas SCATE et TimeML, nous introduisons une nouvelle métrique d’évaluation pour les intervalles temporels. Nous appliquons également cette nouvelle métrique à une analyse comparative des annotations des deux schémas au sein du même corpus.