HyperAIHyperAI
vor 2 Monaten

Zeigen, Beachten und Lesen: Eine einfache und starke Baseline für die Erkennung von unregelmäßigen Texten

Li, Hui ; Wang, Peng ; Shen, Chunhua ; Zhang, Guyu
Zeigen, Beachten und Lesen: Eine einfache und starke Baseline für die Erkennung von unregelmäßigen Texten
Abstract

Die Erkennung von unregelmäßigen Texten in natürlichen Szenebildern ist aufgrund der großen Varianz im Textaussehen, wie Krümmung, Ausrichtung und Verzerrung, herausfordernd. Die meisten existierenden Ansätze basieren stark auf komplexen Modellentwürfen und/oder zusätzlichen feingranularen Annotationen, was die Schwierigkeit bei der Algorithmenimplementierung und Datensammlung in gewissem Maße erhöht. In dieser Arbeit schlagen wir eine einfach zu implementierende starke Baseline für die Erkennung von unregelmäßigem Szene-Text vor, die standardisierte neuronale Netzwerkkomponenten und nur wortebene Annotationen verwendet. Sie besteht aus einem 31-Schichten-ResNet, einem LSTM-basierten Encoder-Decoder-Framework und einem zweidimensionalen Aufmerksamkeitsmodul. Trotz ihrer Einfachheit ist die vorgeschlagene Methode robust und erzielt den aktuellen Stand der Technik (state-of-the-art) in Bezug auf die Leistung bei Benchmarks sowohl für regulären als auch für unregelmäßigen Szene-Text. Der Code ist unter folgendem Link verfügbar: https://tinyurl.com/ShowAttendRead

Zeigen, Beachten und Lesen: Eine einfache und starke Baseline für die Erkennung von unregelmäßigen Texten | Neueste Forschungsarbeiten | HyperAI