Un Jeu de Données pour l’Extraction Hyper-Relationnelle et une Approche par Remplissage de Cube

L'extraction de relations offre un potentiel important pour la construction de grands graphes de connaissances, mais les méthodes actuelles ne prennent pas en compte les attributs qualificatifs associés à chaque triplet de relation, tels que le temps, la quantité ou l'emplacement. Ces qualificatifs forment des faits hyper-relationnels qui capturent mieux la structure riche et complexe des graphes de connaissances. Par exemple, le triplet de relation (Leonard Parker, Formé à, Université Harvard) peut être enrichi factuellement en incluant le qualificatif (Date de fin, 1967). Ainsi, nous proposons la tâche d'extraction hyper-relationnelle visant à extraire des faits plus spécifiques et complets à partir du texte. Pour soutenir cette tâche, nous avons construit HyperRED, un jeu de données à grande échelle et d'usage général. Les modèles existants ne peuvent pas effectuer l'extraction hyper-relationnelle car cela nécessite qu'un modèle prenne en compte l'interaction entre trois entités. Nous proposons donc CubeRE, un modèle de remplissage cubique inspiré des approches de remplissage tabulaire et qui considère explicitement l'interaction entre les triplets de relation et les qualificatifs. Pour améliorer la scalabilité du modèle et réduire l'imbalance des classes négatives, nous proposons également une méthode de réduction cubique. Nos expériences montrent que CubeRE surpasse les baselines robustes et révèlent des directions possibles pour les recherches futures. Notre code et nos données sont disponibles sur github.com/declare-lab/HyperRED.