HyperAIHyperAI
vor 2 Monaten

Bewusstsein für Zeichenregionen bei der Texterkennung

Youngmin Baek; Bado Lee; Dongyoon Han; Sangdoo Yun; Hwalsuk Lee
Bewusstsein für Zeichenregionen bei der Texterkennung
Abstract

Neuronale Netzwerke basierte Methoden zur Erkennung von Szene-Texten sind kürzlich aufgetreten und haben vielversprechende Ergebnisse gezeigt. Frühere Methoden, die mit starr definierten Wort-Level-Bounding-Boxen trainiert wurden, zeigen Einschränkungen bei der Darstellung von Textbereichen in beliebigen Formen. In dieser Arbeit schlagen wir eine neue Methode zur Erkennung von Szene-Texten vor, die durch die Untersuchung jedes einzelnen Zeichens und der Affinität zwischen Zeichen effektiv Textbereiche erkennt. Um das Fehlen von individuellen Zeichen-Level-Annotierungen zu überwinden, nutzt unser vorgeschlagener Framework sowohl die gegebenen Zeichen-Level-Annotierungen für synthetische Bilder als auch die geschätzten Zeichen-Level-Ground-Truths für reale Bilder, die durch das gelernte Interimsmodell erworben werden. Um die Affinität zwischen den Zeichen abzuschätzen, wird das Netzwerk mit der neu vorgeschlagenen Darstellung für Affinität trainiert. Ausführliche Experimente an sechs Benchmarks, darunter die Datasets TotalText und CTW-1500, die hoch gekrümmte Texte in natürlichen Bildern enthalten, zeigen, dass unsere zeichenbasierte Texterkennung deutlich besser als die besten bisher bekannten Detektoren abschneidet. Die Ergebnisse garantieren eine hohe Flexibilität bei der Erkennung komplexer Szene-Textbilder, wie z.B. willkürlich orientierter, gekrümmter oder deformierter Texte.

Bewusstsein für Zeichenregionen bei der Texterkennung | Neueste Forschungsarbeiten | HyperAI