ITER : Reconnaissance itérative d'entités et extraction de relations basée sur un transformateur

Lors de l’extraction d’informations structurées à partir de textes, la reconnaissance d’entités et l’extraction de relations sont des étapes essentielles. Les avancées récentes dans ces deux tâches permettent de générer une représentation structurée des informations de manière autoregressive, une approche coûteuse en temps et en ressources computationnelles. Cela soulève naturellement la question de savoir si les méthodes autoregressives sont réellement nécessaires pour atteindre des résultats comparables. Dans ce travail, nous proposons ITER, un modèle d’extraction de relations basé sur un encodeur, qui réalise la tâche en trois étapes parallélisables, accélérant ainsi considérablement une approche récente fondée sur le modèle de langage : ITER atteint une throughput d’inférence dépassant 600 échantillons par seconde pour un grand modèle sur une seule GPU grand public. En outre, nous obtenons des résultats de pointe sur les jeux de données d’extraction de relations ADE et ACE05, et démontrons des performances compétitives aussi bien pour la reconnaissance d’entités nommées sur GENIA et CoNLL03 que pour l’extraction de relations sur SciERC et CoNLL04.