HyperAIHyperAI
il y a 2 mois

Modèle de Span pour l’Extraction d’Information Ouverte sur un Corpus Précis

Junlang Zhan; Hai Zhao
Modèle de Span pour l’Extraction d’Information Ouverte sur un Corpus Précis
Résumé

L'extraction d'information ouverte (Open IE) est une tâche particulièrement ardue, principalement en raison de sa base de données fragile. La plupart des systèmes d'Open IE doivent être formés sur un corpus construit automatiquement et évalués sur un ensemble de tests imparfait. Dans ce travail, nous atténuons d'abord cette difficulté à la fois du côté des ensembles d'entraînement et de test. Pour le premier aspect, nous proposons une conception de modèle améliorée afin d'exploiter plus pleinement l'ensemble d'entraînement. Pour le second aspect, nous présentons notre ensemble de tests de référence (Re-OIE6) réannoté avec précision, basé sur une série d'observations et d'analyses linguistiques. Ensuite, nous introduisons un modèle d'étendue (span model) au lieu de la formulation précédemment utilisée pour l'Open IE n-aire basée sur l'étiquetage séquentiel. Notre nouveau modèle atteint des performances inédites sur les deux ensembles de données de référence utilisés pour l'évaluation.

Modèle de Span pour l’Extraction d’Information Ouverte sur un Corpus Précis | Articles de recherche récents | HyperAI