HyperAIHyperAI

Command Palette

Search for a command to run...

XF2T: Cross-lingual Fact-to-Text Generation für Low-Resource-Sprachen

Shivprasad Sagare Tushar Abhishek Bhavyajeet Singh Anubhav Sharma Manish Gupta Vasudeva Varma

Zusammenfassung

Mehrere Geschäftsanwendungen erfordern die automatisierte Generierung beschreibender, menschenlesbarer Texte aus strukturierten Eingabedaten. Daher wurden Fact-to-Text-(F2T)-Generierungssysteme für verschiedene Anwendungsfälle entwickelt, beispielsweise zur Erstellung von Fußballberichten, Wetter- und Finanzberichten, medizinischen Berichten sowie Personenbiografien. Leider konzentrierte sich bisherige Forschung zum F2T-Generierungsproblem vornehmlich auf die englische Sprache, hauptsächlich aufgrund der hohen Verfügbarkeit entsprechender Datensätze. Erst kürzlich wurde das Problem der mehrsprachigen Fact-to-Text-Generierung (XF2T) vorgeschlagen, zusammen mit einem Datensatz namens XALIGN, der acht Sprachen abdeckt. Dennoch existiert bisher keine gründliche Forschung zum eigentlichen XF2T-Generierungsproblem. Wir erweitern den XALIGN-Datensatz um annotierte Daten für vier weitere Sprachen: Punjabi, Malayalam, Assamesisch und Oriya. Anhand unseres erweiterten multilingualen Datensatzes, den wir XALIGNV2 nennen, führen wir eine umfassende Studie mit gängigen Transformer-basierten Textgenerierungsmodellen durch. Zudem untersuchen wir die Leistung verschiedener Generierungsstrategien: unterschiedliche Varianten des Vortrainings, faktbewusste Embeddings sowie strukturbewusste Eingabecodierung. Unsere umfangreichen Experimente zeigen, dass ein multilinguales mT5-Modell, das faktbewusste Embeddings in Kombination mit strukturbewusster Eingabecodierung nutzt, im Durchschnitt über alle zwölf Sprachen hinweg die besten Ergebnisse erzielt. Wir stellen unseren Code, den Datensatz und das Modell öffentlich zur Verfügung und hoffen, dass dies die weitere Forschung in diesem zentralen Bereich voranbringt.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
XF2T: Cross-lingual Fact-to-Text Generation für Low-Resource-Sprachen | Paper | HyperAI