HyperAIHyperAI

Command Palette

Search for a command to run...

MASSIVE: Ein 1-Mio.-Beispiel-Datensatz für mehrsprachiges natürlichsprachliches Verständnis mit 51 typologisch diversen Sprachen

Jack FitzGerald; Christopher Hench; Charith Peris; Scott Mackie; Kay Rottmann; Ana Sanchez; Aaron Nash; Liam Urbach; Vishesh Kakarala; Richa Singh; Swetha Ranganath; Laurie Crist; Misha Britan; Wouter Leeuwis; Gokhan Tur; Prem Natarajan

Zusammenfassung

Wir stellen den MASSIVE-Datensatz vor – das mehrsprachige Amazon SLURP-Paket (SLURP) für Slot-Füllung, Intent-Klassifikation und Bewertung virtueller Assistenten. MASSIVE enthält 1 Mio. realistische, parallele, annotierte Aussagen von virtuellen Assistenten in 51 Sprachen, 18 Domänen, 60 Intents und 55 Slots. Der Datensatz wurde erstellt, indem professionelle Übersetzer das nur auf Englisch verfügbare SLURP-Datensatz in 50 sprachtypologisch vielfältige Sprachen aus 29 Genres lokalisierten. Wir präsentieren auch Modellierungsergebnisse für XLM-R und mT5, einschließlich der exakten Übereinstimmungsrate, der Intent-Klassifikationsgenauigkeit und des Slot-Füllungs-F1-Scores. Unser Datensatz, die Modellierungscode und die Modelle wurden öffentlich freigegeben.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp