HyperAIHyperAI
vor 2 Monaten

TextCaps: Handschriftliche Zeichenerkennung mit sehr kleinen Datensätzen

Vinoj Jayasundara; Sandaru Jayasekara; Hirunima Jayasekara; Jathushan Rajasegaran; Suranga Seneviratne; Ranga Rodrigo
TextCaps: Handschriftliche Zeichenerkennung mit sehr kleinen Datensätzen
Abstract

Viele lokalisierte Sprachen haben Schwierigkeiten, die Vorteile der jüngsten Fortschritte in den Systemen zur Zeichenerkennung zu nutzen, aufgrund des Mangels an erheblichen Mengen von etikettierten Trainingsdaten. Dies liegt an der Schwierigkeit, große Mengen von etikettierten Daten für solche Sprachen zu generieren, und an der Unfähigkeit tiefen Lernverfahrens, aus einer kleinen Anzahl von Trainingsbeispielen angemessen zu lernen. Wir lösen dieses Problem durch die Einführung einer Technik zur Generierung neuer Trainingsbeispiele aus den vorhandenen Beispielen, mit realistischen Erweiterungen, die tatsächlich auftretende Variationen in menschlicher Handschrift widerspiegeln, indem wir zufälliges kontrolliertes Rauschen zu deren entsprechenden Instanziierungsparametern hinzufügen. Unsere Ergebnisse mit lediglich 200 Trainingsbeispielen pro Klasse übertreffen bestehende Zeichenerkennungsergebnisse im EMNIST-Buchstaben-Datensatz und erreichen gleichzeitig die bestehenden Ergebnisse in drei Datensätzen: EMNIST-gleichverteilt (balanced), EMNIST-Ziffern (digits) und MNIST. Darüber hinaus entwickeln wir eine Strategie zur effektiven Nutzung einer Kombination von Verlustfunktionen, um die Rekonstruktionen zu verbessern. Unser System ist nützlich für die Zeichenerkennung in lokalisierten Sprachen, die über wenig etikettierte Trainingsdaten verfügen, sowie in anderen verwandten allgemeineren Kontexten wie Objekterkennung.