TIMEN : Une ressource ouverte de normalisation des expressions temporelles
Les expressions temporelles sont des mots ou des phrases qui décrivent un instant, une durée ou une récurrence dans le temps. L’annotation automatique de ces expressions constitue un objectif de recherche d’intérêt croissant. La reconnaissance de ces expressions peut être réalisée à l’aide d’apprentissage automatique à faible supervision, mais leur interprétation précise (normalisation) représente une tâche complexe exigeant des connaissances humaines. Dans cet article, nous présentons TIMEN, un outil collaboratif dédié à la normalisation des expressions temporelles. TIMEN s’inspire des approches actuelles les plus performantes et constitue un outil indépendant, facilitant son intégration dans des systèmes existants. Nous soutenons qu’une normalisation efficace des expressions temporelles ne peut être réalisée qu’avec une base de connaissances étendue et un ensemble de règles rigoureux. Notre solution repose sur un cadre et un système permettant de capturer ces connaissances pour différentes langues. À l’aide de données existantes et de nouvelles annotations, nous présentons des résultats montrant une performance compétitive, et invitons la communauté des systèmes d’extraction d’information (IE) à contribuer à l’élaboration d’une base de connaissances afin de résoudre de manière durable le problème de la normalisation des expressions temporelles.