vor 17 Tagen

GRAIL: Lernen, mit großen Wissensgraphen zur abfragenden Erweiterung von Schlussfolgerungen zu interagieren

Ge Chang, Jinbo Su, Jiacheng Liu, Pengfei Yang, Yuhao Shang, Huiwen Zheng, et al

Abstract

Große Sprachmodelle (Large Language Models, LLMs), die mit Techniken zur retrievalverstärkten Generierung (Retrieval-Augmented Generation, RAG) kombiniert werden, haben in einer Vielzahl von Anwendungsbereichen herausragende Leistungen erbracht. Allerdings basieren bestehende RAG-Ansätze hauptsächlich auf unstrukturierten Daten und zeigen begrenzte Fähigkeiten bei der Verarbeitung strukturierter Wissensbestände wie Wissensgraphen. Gleichzeitig leiden aktuelle Methoden zur Graphenretrieval darunter, dass sie die Gesamtstruktur von Graphen nicht adäquat erfassen können und gleichzeitig Schwierigkeiten bei der Kontrolle der Genauigkeit aufweisen – was sich in kritischen Informationslücken oder übermäßigen redundanten Verbindungen äußert und insgesamt die Schlussfolgerungsfähigkeit beeinträchtigt. Um dieses Problem anzugehen, stellen wir GRAIL vor: Graph-Retrieval Augmented Interactive Learning, einen Rahmen, der darauf abzielt, mit großen Wissensgraphen interaktiv zur retrievalverstärkten Schlussfolgerung zu arbeiten. Insbesondere integriert GRAIL LLM-gesteuerte zufällige Exploration mit Pfadfilterung, um eine Daten-Synthesepipeline zu etablieren, in der für jede Aufgabe automatisch eine fein abgestimmte Schlussfolgerungstrajektorie generiert wird. Auf Basis der synthetisierten Daten führen wir anschließend einen zweistufigen Trainingsprozess durch, um eine Policy zu lernen, die dynamisch die optimalen Aktionen in jedem Schlussfolgerungsschritt entscheidet. Das Gesamtziel einer Balance zwischen Genauigkeit und Kürze bei der Graphenretrieval wird dabei in fein abgestimmte, prozessüberwachte Belohnungen zerlegt, um die Dateneffizienz und die Stabilität des Trainings zu verbessern. Bei der praktischen Anwendung setzt GRAIL ein interaktives Retrieval-Paradigma ein, das es dem Modell ermöglicht, graphische Pfade autonom zu erkunden und dabei die Breite der Suche und die Genauigkeit dynamisch auszugleichen. Umfangreiche Experimente zeigen, dass GRAIL im Durchschnitt eine Steigerung der Genauigkeit um 21,01 % und eine Verbesserung des F1-Scores um 22,43 % auf drei Datensätzen für Fragenbeantwortung in Wissensgraphen erreicht. Der Quellcode und die Datensätze sind unter folgender URL verfügbar: [https://...].