Extraction d'informations ouverte à partir de phrases conjonctives

Nous développons CALM, un analyseur de coordination qui améliore les conjonctions identifiées à partir d’analyses syntaxiques dépendantes. Il utilise un score fondé sur un modèle linguistique ainsi que plusieurs contraintes linguistiques pour explorer les limites hiérarchiques des conjonctions (pour la coordination imbriquée). En scindant une phrase conjonctive autour de ces conjonctions, CALM produit plusieurs phrases simples. Nous démontrons la valeur de notre analyseur de coordination dans la tâche ultime d’extraction d’information ouverte (Open IE). Les systèmes d’Open IE de pointe perdent une part importante de leur rendement en raison d’un traitement inefficace des phrases conjonctives. Notre système d’Open IE, CALMIE, effectue l’extraction sur les phrases simples identifiées par CALM, atteignant un rendement jusqu’à 1,8 fois supérieur, avec une légère augmentation de la précision par rapport aux extraits obtenus directement à partir des phrases d’origine.