RESDSQL: Entkoppelung der Schema-Verknüpfung und der Skelett-Parsing für Text-zu-SQL

Ein aktueller Ansatz zur Text-zu-SQL-Übersetzung basiert auf vortrainierten Sprachmodellen. Aufgrund der strukturellen Eigenschaften von SQL-Abfragen übernimmt das Seq2Seq-Modell die Aufgabe, sowohl die Schema-Elemente (d. h. Tabellen und Spalten) als auch den Skelett-Teil (d. h. SQL-Schlüsselwörter) zu parsen. Diese gekoppelten Ziele erhöhen die Schwierigkeit der korrekten SQL-Abfragegenerierung, insbesondere wenn viele Schema-Elemente und logische Operatoren beteiligt sind. In dieser Arbeit wird ein Rahmenwerk vorgestellt, das eine verbesserte Codierung durch Rangfolge-Enhancement und eine skelettbewusste Dekodierung nutzt, um die Verknüpfung von Schema-Elementen und die Skelett-Parsing-Aufgabe zu entkoppeln. Konkret wird für ein Seq2Seq-Encoder-Decoder-Modell der Encoder mit den relevantesten Schema-Elementen anstelle aller ungeordneten Elemente angereichert, was die Anstrengung bei der Schema-Verknüpfung während der SQL-Parsing-Phase verringert. Der Decoder generiert anschließend zunächst den Skelett-Teil und danach die vollständige SQL-Abfrage, wodurch der Parsing-Prozess implizit eingeschränkt wird. Wir evaluieren unseren Ansatz anhand des Spider-Datensatzes sowie seiner drei Robustheitsvarianten: Spider-DK, Spider-Syn und Spider-Realistic. Die experimentellen Ergebnisse zeigen, dass unser Framework eine vielversprechende Leistung und Robustheit erzielt. Der Quellcode ist unter https://github.com/RUCKBReasoning/RESDSQL verfügbar.