Command Palette
Search for a command to run...
StackMix und Blot-Augmentierungen für die Erkennung handschriftlicher Texte
StackMix und Blot-Augmentierungen für die Erkennung handschriftlicher Texte
Alex Shonenkov Denis Karachev Maxim Novopoltsev Mark Potanin Denis Dimitrov
Zusammenfassung
Diese Arbeit stellt ein System zur Erkennung handschriftlicher Texte (Handwritten Text Recognition, HTR) vor, das die derzeitigen state-of-the-art-Methoden übertrifft. Der Vergleich wurde an drei der am häufigsten in HTR-Aufgaben verwendeten Datensätze durchgeführt: Ben-tham, IAM und Saint Gall. Zudem werden Ergebnisse auf zwei kürzlich vorgestellten Datensätzen, den Manuskripten Peters des Großen und dem HKR-Datensatz, präsentiert. Der Beitrag beschreibt die Architektur des neuronalen Netzwerks sowie zwei Ansätze zur Erhöhung des Volumens der Trainingsdaten: eine Daten-Augmentation, die durchgestrichene Texte (Handwritten Blots) simuliert, und eine neue Methode zur Textgenerierung (StackMix), die sich in HTR-Aufgaben als äußerst effektiv erwiesen hat. StackMix lässt sich zudem als eigenständige Aufgabe zur Generierung handschriftlicher Texte auf Basis gedruckter Texte einsetzen.