CoSQL-Konversationstext Zum SQL-Datensatz
Datum
Größe
Veröffentlichungs-URL
Kategorien
Der CoSQL-Datensatz (Conversational Text-to-SQL Challenge) wurde von der Yale University bei EMNLP2019 vorgeschlagen. Ziel ist der Aufbau eines Datensatzes für domänenübergreifende, allgemeine Dialogsysteme zur Datenbankabfrage.
CoSQL enthält über 3.000 Konversationsgruppen und insgesamt über 10.000 kommentierte SQL-Abfragen, die sich über 200 Datenbanken erstrecken. Um die Robustheit des Modells zu prüfen, gibt es zwischen den von den verschiedenen Datengruppen verwendeten Datenbanken keine Überschneidungen. Der Datensatz simuliert Datenbankabfragen in realen Szenarien. Benutzer können mehrere Abfragerunden durchführen, was erfordert, dass das System in der Lage ist, Informationen zu integrieren.
CoSQL besteht aus 3 Aufgaben:
- SQL-basiertes Dialogstatus-Tracking: Basierend auf dem Interaktionsverlauf wird dieser in entsprechende SQL-Anweisungen umgewandelt.
- Generierung von Antworten in natürlicher Sprache: Generieren Sie Antworten in natürlicher Sprache basierend auf SQL-Anweisungen und zurückgegebenen Ergebnissen.
- Vorhersage von Dialoghandlungen des Benutzers: Bestimmen Sie für jede Benutzerfrage, zu welchem DB-Benutzertag sie gehört.
