HyperAIHyperAI

Command Palette

Search for a command to run...

Lernen kontextueller Repräsentationen für die semantische Analyse mit generativer Verstärkung der Vortrainierung

Peng Shi Patrick Ng Zhiguo Wang Henghui Zhu Alexander Hanbo Li Jun Wang Cicero Nogueira dos Santos Bing Xiang

Zusammenfassung

Zuletzt hat sich ein erhebliches Interesse an der Lernung kontextueller Darstellungen für verschiedene NLP-Aufgaben entwickelt, indem große Textkorpora genutzt werden, um große neuronale Sprachmodelle mittels selbstüberwachter Lernziele – beispielsweise dem Masked Language Model (MLM) – zu trainieren. Aufgrund einer Pilotstudie beobachten wir jedoch drei Probleme bei der Anwendung bestehender allgemeiner Sprachmodelle auf Text-zu-SQL-Semantikparser: Sie erkennen Spaltenverweise in Äußerungen nicht, können Spaltenverweise nicht aus Zellenwerten ableiten und sind nicht in der Lage, komplexe SQL-Abfragen zu generieren. Um diese Probleme zu mindern, stellen wir einen vortrainierenden Modellrahmen namens Generation-Augmented Pre-training (GAP) vor, der gemeinsam die Darstellungen natürlicher Sprachäußerungen und Tabellenschemata lernt, indem Generativmodelle zur Erzeugung von Vortrainingsdaten herangezogen werden. Das GAP-Modell wird auf 2 Millionen Paaren aus Äußerung und Schema sowie 30.000 Tripeln aus Äußerung, Schema und SQL trainiert, wobei die Äußerungen von generativen Modellen erzeugt wurden. Experimentelle Ergebnisse zeigen, dass neuronale Semantikparser, die das GAP-Modell als Darstellungsencoder nutzen, neue SOTA-Ergebnisse sowohl auf den Benchmarks SPIDER als auch CRITERIA-TO-SQL erzielen.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp