HyperAIHyperAI

Command Palette

Search for a command to run...

Die Bewertung von Sequenz-zu-Sequenz-Modellen für die Erkennung handschriftlicher Texte

Johannes Michael Roger Labahn Tobias Grüning Jochen Zöllner

Zusammenfassung

Encoder-Decoder-Modelle sind zu einem effektiven Ansatz für sequenzielle Lernaufgaben wie maschinelle Übersetzung, Bildunterschriftenerstellung und Spracherkennung geworden, haben aber noch keine wettbewerbsfähigen Ergebnisse bei der Erkennung von Handschriften gezeigt. In diesem Zusammenhang schlagen wir ein aufmerksamkeitsbasiertes Sequenz-zu-Sequenz-Modell vor. Es kombiniert ein konvolutionsneuronales Netzwerk (CNN) als generischen Merkmalsextraktor mit einem rekurrenten Neuronalen Netzwerk (RNN), um sowohl die visuelle Information als auch den zeitlichen Kontext zwischen den Zeichen im Eingabebild zu kodieren, und verwendet ein separates RNN zur Dekodierung der tatsächlichen Zeichenfolge. Wir führen experimentelle Vergleiche verschiedener Aufmerksamkeitsmechanismen und positioneller Kodierungen durch, um eine geeignete Ausrichtung zwischen der Eingabe- und der Ausgabe-Sequenz zu finden. Das Modell kann end-to-end trainiert werden, und die optionale Integration eines hybriden Verlusts ermöglicht es dem Encoder, falls gewünscht, eine interpretierbare und nutzbare Ausgabe beizubehalten. Wir erzielen wettbewerbsfähige Ergebnisse auf den IAM- und ICFHR2016 READ-Datensätzen im Vergleich zum Stand der Technik ohne die Verwendung eines Sprachmodells und verbessern uns signifikant gegenüber allen jüngsten Sequenz-zu-Sequenz-Ansätzen.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Die Bewertung von Sequenz-zu-Sequenz-Modellen für die Erkennung handschriftlicher Texte | Paper | HyperAI