SAFRAN: Eine interpretierbare, regelbasierte Methode zur Linkvorhersage, die Embedding-Modelle übertrifft

Neural embedding-basierte maschinelle Lernmodelle haben vielversprechende Ergebnisse bei der Vorhersage neuer Verbindungen in Wissensgraphen gezeigt. Ihre praktische Anwendbarkeit ist jedoch durch mangelnde Interpretierbarkeit eingeschränkt. Kürzlich erzielte der vollständig interpretierbare, regelbasierte Algorithmus AnyBURL auf zahlreichen allgemeinen Benchmark-Datenbanken für Verbindungsvorhersage hochkonkurrenzfähige Ergebnisse. Allerdings leiden aktuelle Ansätze zur Aggregation von Vorhersagen mehrerer Regeln unter Redundanzen. Wir verbessern AnyBURL durch die Einführung des SAFRAN-Regelanwendungsrahmens, der einen neuartigen Aggregationsansatz namens Non-redundant Noisy-OR verwendet, der redundante Regeln vor der Aggregation erkennt und gruppiert. SAFRAN erzielt neue SOTA-Ergebnisse für vollständig interpretierbare Verbindungsvorhersage auf den etablierten allgemeinen Benchmarks FB15K-237, WN18RR und YAGO3-10. Zudem übertrifft es mehrere etablierte embedding-basierte Algorithmen auf FB15K-237 und WN18RR und verkleinert die Lücke zwischen regelbasierten und embedding-basierten Ansätzen auf YAGO3-10.