Raisonnement fondé sur les cas probabiliste pour la complétion de graphes de connaissances dans un monde ouvert

Un système de raisonnement fondé sur les cas (CBR) résout un nouveau problème en récupérant des « cas » similaires au problème donné. Si un tel système peut atteindre une haute précision, il s'avère particulièrement attrayant en raison de sa simplicité, de son interprétabilité et de sa capacité à échelle. Dans cet article, nous démontrons qu’un tel système est réalisable pour le raisonnement dans les bases de connaissances (KB). Notre approche prédit les attributs d'une entité en collectant des chemins de raisonnement provenant d'entités similaires au sein de la KB. Notre modèle probabiliste évalue la probabilité qu’un chemin soit efficace pour répondre à une requête portant sur l’entité donnée. Les paramètres de notre modèle peuvent être calculés de manière efficace à l’aide de statistiques simples sur les chemins, sans nécessiter d’optimisation itérative. Le modèle est non paramétrique et s’adapte dynamiquement à mesure que de nouvelles entités et relations sont ajoutées à la KB. Sur plusieurs jeux de données standards, notre approche surpasse significativement d'autres méthodes d’apprentissage de règles et se compare favorablement aux approches les plus avancées basées sur les embeddings. En outre, nous démontrons l’efficacité de notre modèle dans un cadre « monde ouvert », où de nouvelles entités arrivent de façon en ligne, surpassant nettement les méthodes de pointe actuelles et s’approchant presque de la meilleure méthode hors ligne. Le code est disponible à l’adresse suivante : https://github.com/ameyagodbole/Prob-CBR