Command Palette
Search for a command to run...
SADGA: Structure-Aware Dual Graph Aggregation Network für Text-to-SQL
SADGA: Structure-Aware Dual Graph Aggregation Network für Text-to-SQL
Ruichu Cai Jinjie Yuan Boyan Xu Zhifeng Hao
Zusammenfassung
Die Text-zu-SQL-Aufgabe, die darauf abzielt, natürlichsprachliche Fragen in SQL-Abfragen zu übersetzen, hat in letzter Zeit erhebliche Aufmerksamkeit erfahren. Ein der größten Herausforderungen bei Text-zu-SQL ist die Generalisierbarkeit des trainierten Modells auf bisher nicht gesehene Datenbankschemata, auch bekannt als cross-domain Text-zu-SQL-Aufgabe. Der Schlüssel hierbei liegt in der Generalisierbarkeit zweier zentraler Komponenten: (i) der Kodierungsstrategie zur Modellierung der Frage und des Datenbankschemas sowie (ii) der Frage-Schema-Verknüpfungsmethode zur Lernung der Zuordnung zwischen Wörtern in der Frage und Tabellen/Spalten im Datenbankschema. Ausgehend von diesen beiden zentralen Aspekten stellen wir ein Structure-Aware Dual Graph Aggregation Network (SADGA) für die cross-domain Text-zu-SQL-Aufgabe vor. In SADGA nutzen wir eine Graphstruktur, um ein einheitliches Kodierungsmodell sowohl für die natürlichsprachliche Frage als auch für das Datenbankschema bereitzustellen. Auf Basis dieser vorgeschlagenen einheitlichen Modellierung entwickeln wir zudem eine strukturbehaftete Aggregationsmethode, um die Zuordnung zwischen Frage-Graph und Schema-Graph zu lernen. Die strukturbehaftete Aggregationsmethode zeichnet sich durch drei zentrale Elemente aus: Global Graph Linking, Local Graph Linking und ein Dual-Graph-Aggregation-Mechanismus. Neben einer empirischen Bewertung der Leistung unseres Ansatzes erreichten wir bei der anspruchsvollen Text-zu-SQL-Benchmark-Plattform Spider zum Zeitpunkt der Verfassung dieses Textes den dritten Platz.