HyperAIHyperAI

Command Palette

Search for a command to run...

Zeigen, Beachten und Lesen: Eine einfache und starke Baseline für die Erkennung von unregelmäßigen Texten

Hui Li Peng Wang Chunhua Shen Guyu Zhang

Zusammenfassung

Die Erkennung von unregelmäßigen Texten in natürlichen Szenebildern ist aufgrund der großen Varianz im Textaussehen, wie Krümmung, Ausrichtung und Verzerrung, herausfordernd. Die meisten existierenden Ansätze basieren stark auf komplexen Modellentwürfen und/oder zusätzlichen feingranularen Annotationen, was die Schwierigkeit bei der Algorithmenimplementierung und Datensammlung in gewissem Maße erhöht. In dieser Arbeit schlagen wir eine einfach zu implementierende starke Baseline für die Erkennung von unregelmäßigem Szene-Text vor, die standardisierte neuronale Netzwerkkomponenten und nur wortebene Annotationen verwendet. Sie besteht aus einem 31-Schichten-ResNet, einem LSTM-basierten Encoder-Decoder-Framework und einem zweidimensionalen Aufmerksamkeitsmodul. Trotz ihrer Einfachheit ist die vorgeschlagene Methode robust und erzielt den aktuellen Stand der Technik (state-of-the-art) in Bezug auf die Leistung bei Benchmarks sowohl für regulären als auch für unregelmäßigen Szene-Text. Der Code ist unter folgendem Link verfügbar: https://tinyurl.com/ShowAttendRead


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Zeigen, Beachten und Lesen: Eine einfache und starke Baseline für die Erkennung von unregelmäßigen Texten | Paper | HyperAI