SyntaxSQLNet: Syntaxbaum-Netzwerke für komplexe und interdomänen Text-to-SQL-Aufgaben

Die meisten bestehenden Studien im Bereich Text-to-SQL-Aufgaben erfordern nicht die Generierung komplexer SQL-Abfragen mit mehreren Klauseln oder Unterabfragen und die Verallgemeinerung auf neue, bisher unbekannte Datenbanken. In dieser Arbeit schlagen wir SyntaxSQLNet vor, ein Syntaxbaumnetzwerk zur Bearbeitung der komplexen und domänenübergreifenden Text-to-SQL-Generierungsaufgabe. SyntaxSQLNet verwendet einen SQL-spezifischen Syntaxbaum-basierten Dekoder mit einer Historie der SQL-Generierungspfade und tabellenbewussten Spaltenaufmerksamkeitsencoder. Wir evaluieren SyntaxSQLNet anhand der Spider Text-to-SQL-Aufgabe, die Datenbanken mit mehreren Tabellen und komplexe SQL-Abfragen mit mehreren SQL-Klauseln und verschachtelten Abfragen enthält. Wir verwenden eine Datenbankaufteilungseinstellung, bei der die Datenbanken im Testset während des Trainings nicht gesehen werden. Die experimentellen Ergebnisse zeigen, dass SyntaxSQLNet eine erheblich größere Anzahl von komplexen SQL-Beispielen bewältigen kann als frühere Arbeiten und das bislang beste Modell um 7,3 % in Bezug auf die exakte Übereinstimmungsrate übertrifft. Darüber hinaus zeigen wir, dass SyntaxSQLNet durch die Verwendung einer domänenübergreifenden Erweiterungsmethode die Leistung um weitere 7,5 % verbessern kann, was insgesamt eine Steigerung von 14,8 % ergibt. Nach unserem Wissen sind wir die ersten, die diese komplexe und domänenübergreifende Text-to-SQL-Aufgabe untersuchen.