HyperAIHyperAI

Command Palette

Search for a command to run...

LiLT: Ein einfacher, aber effektiver sprachunabhängiger Layout-Transformer für die Verarbeitung strukturierter Dokumente

Jiapeng Wang extsuperscript1 Lianwen Jin extsuperscript*1,3,4 Kai Ding extsuperscript2,3

Zusammenfassung

Die strukturierte Dokumentenverarbeitung hat in letzter Zeit erhebliche Aufmerksamkeit und bedeutende Fortschritte erlebt, aufgrund ihrer entscheidenden Rolle bei der intelligenten Bearbeitung von Dokumenten. Dennoch können die meisten existierenden Modelle nur mit den in der Vortrainingsammlung enthaltenen Dokumentendaten einer bestimmten Sprache (in der Regel Englisch) umgehen, was eine erhebliche Einschränkung darstellt. Um dieses Problem zu lösen, schlagen wir einen einfachen, aber effektiven sprachunabhängigen Layout-Transformer (LiLT) für die strukturierte Dokumentenverarbeitung vor. LiLT kann auf strukturierten Dokumenten einer einzelnen Sprache vortrainiert werden und dann direkt an andere Sprachen angepasst werden, indem entsprechende fertig trainierte mono- oder mehrsprachige textuelle Modelle verwendet werden. Experimentelle Ergebnisse in acht Sprachen haben gezeigt, dass LiLT wettbewerbsfähige oder sogar überlegene Leistungen bei verschiedenen weit verbreiteten Downstream-Benchmarks erzielen kann. Dies ermöglicht es, sprachunabhängige Vorteile aus dem Vortraining der Dokumentenlayoutstruktur zu ziehen. Der Quellcode und das Modell sind öffentlich unter https://github.com/jpWang/LiLT verfügbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp