HyperAIHyperAI

Command Palette

Search for a command to run...

MTet: Multi-domain Translation für Englisch und Vietnamesisch

Chinh Ngo Trieu H. Trinh Long Phan Hieu Tran Tai Dang Hieu Nguyen Minh Nguyen Minh-Thang Luong

Zusammenfassung

Wir stellen MTet vor, den größten öffentlich verfügbaren parallelen Korpus für die maschinelle Übersetzung von Englisch nach Vietnamesisch. MTet besteht aus 4,2 Mio. hochwertigen Trainings-Satzpaaren und einem mehrdomänenorientierten Testset, das durch die vietnamesische Forschungsgemeinschaft verfeinert wurde. In Kombination mit früheren Arbeiten zur Englisch-Vietnamesischen Übersetzung erweitern wir den bestehenden parallelen Datensatz auf insgesamt 6,2 Mio. Satzpaare. Zudem veröffentlichen wir das erste vortrainierte Modell EnViT5 für die Sprachen Englisch und Vietnamesisch. Unter Verwendung beider Ressourcen erreicht unser Modell signifikant bessere Ergebnisse als die bisher beste State-of-the-Art-Performance, wobei die BLEU-Scores um bis zu 2 Punkte steigen, und gleichzeitig 1,6-mal kleiner ist.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp