Bearbeitungsbasierte SQL-Abfragegenerierung für kontextabhängige Fragen aus verschiedenen Domänen

Wir konzentrieren uns auf die Aufgabe der domänenübergreifenden, kontextabhängigen Text-zu-SQL-Generierung. Ausgehend von der Beobachtung, dass benachbarte natürlichsprachliche Fragen oft sprachlich abhängig sind und ihre entsprechenden SQL-Abfragen neigen zu Überlappungen, nutzen wir den Interaktionsverlauf, indem wir die vorherige vorhergesagte Abfrage bearbeiten, um die Generierungsqualität zu verbessern. Unser Bearbeitungsmechanismus betrachtet SQL als Sequenzen und wiederverwendet die Generierungsergebnisse auf Token-Ebene auf einfache Weise. Er ist flexibel genug, einzelne Tokens zu ändern, und robust gegenüber Fehlerversion. Zudem, um mit komplexen Tabellenstrukturen in verschiedenen Domänen umzugehen, verwenden wir einen Utterance-Table-Encoder und einen table-aware Decoder (tabellenbewusster Decoder), um den Kontext der Benutzeräußerung und des Tabellenschemas zu integrieren. Wir evaluieren unseren Ansatz am SParC-Datensatz und zeigen das Vorteil des Bearbeitens im Vergleich zu den aktuellen Baselines, die SQL von Grund auf neu generieren. Unser Code ist unter https://github.com/ryanzhumich/sparc_atis_pytorch verfügbar.