HyperAIHyperAI
vor 8 Tagen

Text Perceptron: Ein Schritt hin zu end-to-end Texterkennung beliebiger Form

Liang Qiao, Sanli Tang, Zhanzhan Cheng, Yunlu Xu, Yi Niu, Shiliang Pu, Fei Wu
Text Perceptron: Ein Schritt hin zu end-to-end Texterkennung beliebiger Form
Abstract

In jüngster Zeit wurden zahlreiche Ansätze zur Erkennung von unregelmäßigen Szenentexten vorgeschlagen und erzielten vielversprechende Ergebnisse. Dennoch können ihre Lokalisierungsergebnisse die nachfolgende Texterkennung häufig nicht ausreichend unterstützen, hauptsächlich aus zwei Gründen: Erstens ist die Erkennung von beliebig geformtem Text weiterhin eine herausfordernde Aufgabe, und zweitens führen verbreitete, nicht trainierbare Pipeline-Strategien zwischen Textdetektion und Texterkennung zu suboptimalen Leistungen. Um dieses Inkompatibilitätsproblem zu bewältigen, stellen wir in diesem Artikel einen end-to-end trainierbaren Ansatz für Text Spotting namens Text Perceptron vor. Konkret verwendet Text Perceptron zunächst einen effizienten, auf Segmentierung basierenden Textdetektor, der die latente Leseordnung und Randinformationen von Texten lernt. Anschließend wird ein neuartiges Shape Transform Module (kurz: STM) entworfen, das die detektierten Merkmalsregionen ohne zusätzliche Parameter in reguläre Morphologien transformiert. Dadurch werden Textdetektion und nachfolgende Erkennung in einem einheitlichen Rahmen integriert, wodurch die gesamte Netzwerkarchitektur eine globale Optimierung ermöglicht. Experimente zeigen, dass unsere Methode auf zwei Standardtextbenchmarks, nämlich ICDAR 2013 und ICDAR 2015, konkurrenzfähige Leistung erzielt und zudem deutlich über bestehende Methoden auf unregelmäßigen Textbenchmarks wie SCUT-CTW1500 und Total-Text hinausweist.

Text Perceptron: Ein Schritt hin zu end-to-end Texterkennung beliebiger Form | Neueste Forschungsarbeiten | HyperAI