Compléter les Blancs : Similarité Distributionnelle pour l'Apprentissage des Relations

Les extracteurs de relations à usage général, capables de modéliser des relations arbitraires, constituent une aspiration centrale dans le domaine de l'extraction d'information. Des efforts ont été déployés pour construire des extracteurs à usage général qui représentent les relations par leurs formes superficielles, ou qui intègrent conjointement ces formes superficielles avec des relations issues d'un graphe de connaissances existant. Cependant, ces deux approches sont limitées dans leur capacité à généraliser. Dans cet article, nous nous appuyons sur des extensions de l'hypothèse distributionnelle de Harris aux relations, ainsi que sur les récentes avancées en apprentissage de représentations textuelles (plus précisément, BERT), pour construire des représentations de relations indépendantes de la tâche à partir uniquement de texte lié à des entités. Nous montrons que ces représentations surpassent significativement les travaux précédents sur l'extraction de relations basée sur des exemples (FewRel), même sans utiliser aucune donnée d'entraînement spécifique à cette tâche. Nous démontrons également que les modèles initialisés avec nos représentations indépendantes de la tâche, puis affinés sur des jeux de données supervisés d'extraction de relations, surpassent considérablement les méthodes antérieures sur SemEval 2010 Task 8, KBP37 et TACRED.