HyperAIHyperAI

Command Palette

Search for a command to run...

ToTTo: Ein kontrolliertes Tabellen-zu-Text-Generierungs-Datensatz

Ankur P. Parikh Xuezhi Wang Sebastian Gehrmann Manaal Faruqui Bhuwan Dhingra Diyi Yang Dipanjan Das

Zusammenfassung

Wir stellen ToTTo vor, einen offenen Domänen-Datensatz für englische Tabellen-zu-Text-Aufgaben mit über 120.000 Trainingsbeispielen, der eine kontrollierte Generierungsaufgabe vorschlägt: Gegeben eine Wikipedia-Tabelle und eine Menge hervorgehobener Zellen innerhalb dieser Tabelle, soll eine einzeilige Beschreibung erstellt werden. Um generierte Zieltexte zu erzeugen, die natürlich klingen, aber gleichzeitig der Quelltabelle treu bleiben, führen wir einen Datensatzkonstruktionsprozess ein, bei dem Annotatoren bestehende Kandidatensätze aus Wikipedia direkt überarbeiten. Wir präsentieren systematische Analysen unseres Datensatzes und des Annotierungsprozesses sowie Ergebnisse mehrerer state-of-the-art-Baselines. Obwohl die bestehenden Methoden in der Regel flüssig sind, neigen sie oft dazu, Phrasen zu erzeugen, die nicht durch die Tabelle gestützt werden, was darauf hindeutet, dass dieser Datensatz als nützlicher Forschungsbenchmark für hochpräzise bedingte Textgenerierung dienen kann.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp