HyperAIHyperAI
vor 17 Tagen

StackMix und Blot-Augmentierungen für die Erkennung handschriftlicher Texte

Alex Shonenkov, Denis Karachev, Maxim Novopoltsev, Mark Potanin, Denis Dimitrov
StackMix und Blot-Augmentierungen für die Erkennung handschriftlicher Texte
Abstract

Diese Arbeit stellt ein System zur Erkennung handschriftlicher Texte (Handwritten Text Recognition, HTR) vor, das die derzeitigen state-of-the-art-Methoden übertrifft. Der Vergleich wurde an drei der am häufigsten in HTR-Aufgaben verwendeten Datensätze durchgeführt: Ben-tham, IAM und Saint Gall. Zudem werden Ergebnisse auf zwei kürzlich vorgestellten Datensätzen, den Manuskripten Peters des Großen und dem HKR-Datensatz, präsentiert. Der Beitrag beschreibt die Architektur des neuronalen Netzwerks sowie zwei Ansätze zur Erhöhung des Volumens der Trainingsdaten: eine Daten-Augmentation, die durchgestrichene Texte (Handwritten Blots) simuliert, und eine neue Methode zur Textgenerierung (StackMix), die sich in HTR-Aufgaben als äußerst effektiv erwiesen hat. StackMix lässt sich zudem als eigenständige Aufgabe zur Generierung handschriftlicher Texte auf Basis gedruckter Texte einsetzen.

StackMix und Blot-Augmentierungen für die Erkennung handschriftlicher Texte | Neueste Forschungsarbeiten | HyperAI