HyperAIHyperAI
il y a 17 jours

CompactIE : Faits compacts dans l'extraction d'information ouverte

Farima Fatahi Bayat, Nikita Bhutani, H.V. Jagadish
CompactIE : Faits compacts dans l'extraction d'information ouverte
Résumé

Un inconvénient majeur des systèmes modernes d'OpenIE basés sur les réseaux neuronaux et des benchmarks associés réside dans leur préoccupation prioritaire pour une couverture élevée des informations extraites, au détriment de la compacité des constituants. Ce défaut limite sévèrement l'utilité des extraits OpenIE dans de nombreuses tâches ultérieures. L'utilité des extraits peut être améliorée si ceux-ci sont compacts et partagent des constituants. À cette fin, nous étudions le problème de l'identification d'extraits compacts à l'aide de méthodes basées sur les réseaux neuronaux. Nous proposons CompactIE, un système OpenIE qui utilise une approche en pipeline originale pour produire des extraits compacts présentant des constituants chevauchants. Ce système détecte d'abord les constituants des extraits, puis les relie pour construire les extraits. Nous entraînons notre système sur des extraits compacts obtenus en traitant des benchmarks existants. Nos expériences sur les jeux de données CaRB et Wire57 montrent que CompactIE identifie entre 1,5 et 2 fois plus d'extraits compacts que les systèmes antérieurs, tout en maintenant une précision élevée, établissant ainsi une nouvelle référence en matière de performance dans le domaine de l'OpenIE.