HyperAIHyperAI

Command Palette

Search for a command to run...

Mehrfachorientierte Erkennung von Szenentexten durch Eckenlokalisierung und Bereichssegmentierung

Lyu Pengyuan Yao Cong Wu Wenhao Yan Shuicheng Bai Xiang

Zusammenfassung

Bisherige state-of-the-art-Methoden zur Szenentexterkennung auf Basis tiefer Lernverfahren können grob in zwei Kategorien eingeteilt werden. Die erste Kategorie betrachtet Szenentext als eine Art allgemeiner Objekte und folgt dem Paradigma der allgemeinen Objekterkennung, um Szenentext durch die Regression der Textbox-Positionen zu lokalisieren. Diese Vorgehensweise stößt jedoch auf Schwierigkeiten infolge der beliebigen Orientierung und der großen Aspektverhältnisse von Szenentext. Die zweite Kategorie segmentiert Textregionen direkt, benötigt jedoch meist komplizierte Nachbearbeitungsschritte. In diesem Artikel präsentieren wir eine Methode, die die Ansätze beider Kategorien vereint, gleichzeitig jedoch deren Nachteile vermeidet. Wir schlagen vor, Szenentext durch die Lokalisierung von Ecken von Textumrandungsboxen und die Segmentierung von Textregionen in relativen Positionen zu erkennen. Im Inferenzstadium werden Kandidatenboxen durch Sampling und Gruppierung von Eckpunkten generiert, die anschließend mittels Segmentierungskarten bewertet und mittels NMS (Non-Maximum Suppression) unterdrückt werden. Im Vergleich zu früheren Methoden kann unsere Vorgehensweise lange, orientierte Texte natürlicher verarbeiten und erfordert keine komplizierte Nachbearbeitung. Experimente an den Datensätzen ICDAR2013, ICDAR2015, MSRA-TD500, MLT und COCO-Text zeigen, dass der vorgeschlagene Algorithmus sowohl in Bezug auf Genauigkeit als auch Effizienz bessere oder vergleichbare Ergebnisse erzielt. Bei Verwendung von VGG16 erreicht er eine F-Maßnahme von 84,3 % auf ICDAR2015 und 81,5 % auf MSRA-TD500.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp