Command Palette
Search for a command to run...
Anpassung von neuronalen Link-Predictoren für dateneffizientes beantworten komplexer Abfragen
Anpassung von neuronalen Link-Predictoren für dateneffizientes beantworten komplexer Abfragen
Erik Arakelyan*1 Pasquale Minervini*2 Daniel Daza3,4,5 Michael Cochez3,5 Isabelle Augenstein1
Zusammenfassung
Das Beantworten komplexer Abfragen auf unvollständigen Wissensgraphen ist eine herausfordernde Aufgabe, bei der ein Modell komplexe logische Abfragen unter Berücksichtigung fehlender Kenntnisse beantworten muss. Frühere Arbeiten in der Literatur schlagen vor, dieses Problem durch die Entwicklung von Architekturen zu lösen, die für die Aufgabe des Beantwortens komplexer Abfragen von Anfang bis Ende trainiert werden, wobei der Schließungsprozess schwer zu interpretieren ist und daten- und ressourcenintensive Trainingsmethoden erfordert. Andere Forschungsansätze haben vorgeschlagen, einfache neuronale Link-Predictoren (Verknüpfungsvorhersagemodelle) zur Beantwortung komplexer Abfragen wiederverwenden zu können. Dies reduziert den Trainingsdatenbedarf um Größenordnungen und liefert zugleich interpretierbare Antworten. Der in diesen Ansätzen verwendete neuronale Link-Predictor wird jedoch nicht explizit für die Aufgabe des Beantwortens komplexer Abfragen optimiert, was bedeutet, dass seine Bewertungen nicht kalibriert sind, um zusammenzuarbeiten.Wir schlagen vor, diese Probleme durch CQDA anzugehen: ein parametersparendes Modell zur \emph{Anpassung} von Bewertungen, das optimiert wurde, um die Bewertungen neuronaler Link-Prediction für die Aufgabe des Beantwortens komplexer Abfragen neu zu kalibrieren. Während der neuronale Link-Predictor fixiert bleibt, wird das Anpassungsmodul – das die Anzahl der Modellparameter nur um 0,03% erhöht – auf der nachgelagerten Aufgabe des Beantwortens komplexer Abfragen trainiert. Zudem ermöglicht das Kalibrierungsmodul uns, Schließungsprozesse über Abfragen durchzuführen, die atomare Negationen enthalten, was bisher mit Link-Predictoren unmöglich war.In unseren Experimenten erzeugt CQDA signifikant genaue Ergebnisse als aktuelle Methoden am Stand der Technik (State-of-the-Art), indem es den durchschnittlichen Mean Reciprocal Rank-Werten (Mittelwert der Reziproken Ränge) über alle Datensätze und Abfragetypen von 34,4 auf 35,1 verbessert und dabei nur ≤30% aller verfügbaren Trainingsabfragetypen verwendet. Wir zeigen ferner, dass CQDA dateneffizient ist und wettbewerbsfähige Ergebnisse mit lediglich 1% der Trainingskomplexabfragen erzielt sowie robust in Out-of-Domain-Bewertungen (Bewertungen außerhalb des ursprünglichen Domains) performt.