HyperAIHyperAI

Command Palette

Search for a command to run...

PICARD: Parsing inkrementell für begrenzte autoregressive Decodierung aus Sprachmodellen

Torsten Scholak Nathan Schucher Dzmitry Bahdanau

Zusammenfassung

Große vortrainierte Sprachmodelle für textuelle Daten verfügen über einen ungehinderten Ausgaberaum; bei jedem Dekodierungsschritt können sie beliebige der 10.000s von Subwort-Token erzeugen. Wenn diese Modelle auf eingeschränkte formale Sprachen wie SQL fine-tuned werden, erzeugen sie häufig ungültigen Code, der somit nutzlos ist. Wir stellen PICARD (Code und trainierte Modelle sind unter https://github.com/ElementAI/picard verfügbar) vor, eine Methode zur Einschränkung autoregressiver Dekoder von Sprachmodellen mittels inkrementeller Analyse. PICARD unterstützt die Suche nach gültigen Ausgabefolgen, indem es unzulässige Tokens in jedem Dekodierungsschritt ablehnt. Auf den anspruchsvollen Text-zu-SQL-Aufgaben Spider und CoSQL zeigen wir, dass PICARD fine-tuned T5-Modelle mit durchschnittlicher Leistung in state-of-the-art-Lösungen transformiert.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp