HyperAIHyperAI

Command Palette

Search for a command to run...

Bewusstsein für Zeichenregionen bei der Texterkennung

Youngmin Baek Bado Lee Dongyoon Han Sangdoo Yun Hwalsuk Lee

Zusammenfassung

Neuronale Netzwerke basierte Methoden zur Erkennung von Szene-Texten sind kürzlich aufgetreten und haben vielversprechende Ergebnisse gezeigt. Frühere Methoden, die mit starr definierten Wort-Level-Bounding-Boxen trainiert wurden, zeigen Einschränkungen bei der Darstellung von Textbereichen in beliebigen Formen. In dieser Arbeit schlagen wir eine neue Methode zur Erkennung von Szene-Texten vor, die durch die Untersuchung jedes einzelnen Zeichens und der Affinität zwischen Zeichen effektiv Textbereiche erkennt. Um das Fehlen von individuellen Zeichen-Level-Annotierungen zu überwinden, nutzt unser vorgeschlagener Framework sowohl die gegebenen Zeichen-Level-Annotierungen für synthetische Bilder als auch die geschätzten Zeichen-Level-Ground-Truths für reale Bilder, die durch das gelernte Interimsmodell erworben werden. Um die Affinität zwischen den Zeichen abzuschätzen, wird das Netzwerk mit der neu vorgeschlagenen Darstellung für Affinität trainiert. Ausführliche Experimente an sechs Benchmarks, darunter die Datasets TotalText und CTW-1500, die hoch gekrümmte Texte in natürlichen Bildern enthalten, zeigen, dass unsere zeichenbasierte Texterkennung deutlich besser als die besten bisher bekannten Detektoren abschneidet. Die Ergebnisse garantieren eine hohe Flexibilität bei der Erkennung komplexer Szene-Textbilder, wie z.B. willkürlich orientierter, gekrümmter oder deformierter Texte.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Bewusstsein für Zeichenregionen bei der Texterkennung | Paper | HyperAI