RYANSQL: Rekursives Anwenden von Sketch-basierten Slot-Fillings für komplexe Text-zu-SQL-Übersetzungen in domainsübergreifenden Datenbanken

Text-to-SQL ist das Problem, eine Benutzerfrage in eine SQL-Abfrage zu übersetzen, wenn Frage und Datenbank gegeben sind. In diesem Paper präsentieren wir einen neuronalen Ansatz namens RYANSQL (Recursively Yielding Annotation Network for SQL), um komplexe Text-to-SQL-Aufgaben für cross-domain-Datenbanken zu lösen. Die Statement Position Code (SPC) wird eingeführt, um eine geschachtelte SQL-Abfrage in eine Menge nicht geschachtelter SELECT-Anweisungen zu transformieren; außerdem wird ein skizzenbasiertes Slot-Filling-Verfahren vorgeschlagen, um jede SELECT-Anweisung entsprechend ihrer SPC zu synthetisieren. Zudem werden zwei Methoden zur Eingabemanipulation vorgestellt, um die Generationsleistung weiter zu verbessern. RYANSQL erreichte eine Genauigkeit von 58,2 % auf dem anspruchsvollen Spider-Benchmark, was eine Verbesserung um 3,2 Prozentpunkte gegenüber vorherigen state-of-the-art-Ansätzen darstellt. Zum Zeitpunkt der Verfassung dieses Papers belegt RYANSQL die erste Position auf dem Spider-Leaderboard.