SAFRAN : Une méthode interprétable basée sur des règles pour la prédiction de liens, surpassant les modèles d'embedding

Les modèles d’apprentissage automatique basés sur des embeddings neuronaux ont montré un potentiel prometteur pour prédire de nouveaux liens dans les graphes de connaissances. Toutefois, leur utilité pratique est compromise par leur faible interprétabilité. Récemment, l’algorithme entièrement interprétable et fondé sur des règles, AnyBURL, a obtenu des résultats très compétitifs sur de nombreuses benchmarks classiques de prédiction de liens. Toutefois, les approches actuelles d’agrégation des prédictions issues de plusieurs règles sont affectées par des redondances. Nous améliorons AnyBURL en introduisant le cadre d’application de règles SAFRAN, qui utilise une nouvelle méthode d’agrégation appelée Noisy-OR non redondant, capable de détecter et de regrouper les règles redondantes avant l’agrégation. SAFRAN établit de nouveaux records d’état de l’art pour la prédiction de liens entièrement interprétables sur les benchmarks classiques et établis FB15K-237, WN18RR et YAGO3-10. En outre, il dépasse les résultats de plusieurs algorithmes établis basés sur des embeddings sur FB15K-237 et WN18RR, et réduit l’écart entre les approches fondées sur des règles et celles basées sur des embeddings sur YAGO3-10.