HyperAIHyperAI
il y a 18 jours

OpenIE6 : étiquetage itératif par grille et analyse de coordination pour l'extraction ouverte d'informations

Keshav Kolluru, Vaibhav Adlakha, Samarth Aggarwal, Mausam, Soumen Chakrabarti
OpenIE6 : étiquetage itératif par grille et analyse de coordination pour l'extraction ouverte d'informations
Résumé

Un système récent d’extraction ouverte d’informations (OpenIE) basé sur les réseaux neuronaux atteint un niveau d’avant-garde, mais génère ses extraits de manière itérative, ce qui nécessite une encodage répété des sorties partielles, entraînant un coût computationnel important. À l’inverse, les approches de type étiquetage de séquence pour l’OpenIE sont bien plus rapides, mais présentent une qualité d’extraction inférieure. Dans cet article, nous surmontons ce compromis en proposant un système itératif fondé sur l’étiquetage, qui établit un nouveau record d’état de l’art pour l’OpenIE tout en étant 10 fois plus rapide. Cela est rendu possible grâce à une nouvelle architecture, nommée Iterative Grid Labeling (IGL), qui modélise l’OpenIE comme un problème d’étiquetage sur une grille bidimensionnelle. Nous améliorons davantage ses performances en appliquant, pendant l’entraînement, des contraintes de couverture (en mode doux) sur la grille.Par ailleurs, en observant que les meilleurs systèmes d’OpenIE peinent à traiter les structures de coordination, notre système intègre également un nouvel analyseur de coordination, construit selon la même architecture IGL. Cet analyseur de coordination fondé sur IGL permet à notre système d’OpenIE de gérer efficacement des structures de coordination complexes, tout en établissant un nouveau record d’état de l’art pour cette tâche, avec une amélioration de 12,3 points en F1 par rapport aux analyseurs précédents. Notre système d’OpenIE, OpenIE6, bat les systèmes antérieurs de jusqu’à 4 points en F1, tout en étant nettement plus rapide.