vor 4 Monaten

Zusammenfassung

Bisherige state-of-the-art-Methoden zur Szenentexterkennung auf Basis tiefer Lernverfahren können grob in zwei Kategorien eingeteilt werden. Die erste Kategorie betrachtet Szenentext als eine Art allgemeiner Objekte und folgt dem Paradigma der allgemeinen Objekterkennung, um Szenentext durch die Regression der Textbox-Positionen zu lokalisieren. Diese Vorgehensweise stößt jedoch auf Schwierigkeiten infolge der beliebigen Orientierung und der großen Aspektverhältnisse von Szenentext. Die zweite Kategorie segmentiert Textregionen direkt, benötigt jedoch meist komplizierte Nachbearbeitungsschritte. In diesem Artikel präsentieren wir eine Methode, die die Ansätze beider Kategorien vereint, gleichzeitig jedoch deren Nachteile vermeidet. Wir schlagen vor, Szenentext durch die Lokalisierung von Ecken von Textumrandungsboxen und die Segmentierung von Textregionen in relativen Positionen zu erkennen. Im Inferenzstadium werden Kandidatenboxen durch Sampling und Gruppierung von Eckpunkten generiert, die anschließend mittels Segmentierungskarten bewertet und mittels NMS (Non-Maximum Suppression) unterdrückt werden. Im Vergleich zu früheren Methoden kann unsere Vorgehensweise lange, orientierte Texte natürlicher verarbeiten und erfordert keine komplizierte Nachbearbeitung. Experimente an den Datensätzen ICDAR2013, ICDAR2015, MSRA-TD500, MLT und COCO-Text zeigen, dass der vorgeschlagene Algorithmus sowohl in Bezug auf Genauigkeit als auch Effizienz bessere oder vergleichbare Ergebnisse erzielt. Bei Verwendung von VGG16 erreicht er eine F-Maßnahme von 84,3 % auf ICDAR2015 und 81,5 % auf MSRA-TD500.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 4 Monaten

Objekterkennung

Semantische Segmentierung

Faltungsneuronales Netzwerk

Ansatz/Rahmenwerk

Computervision

Aufgabe

Lyu Pengyuan Yao Cong Wu Wenhao Yan Shuicheng Bai Xiang

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 4 Monaten

Objekterkennung

Semantische Segmentierung

Faltungsneuronales Netzwerk

Ansatz/Rahmenwerk

Computervision

Aufgabe

Lyu Pengyuan Yao Cong Wu Wenhao Yan Shuicheng Bai Xiang

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Mehrfachorientierte Erkennung von Szenentexten durch Eckenlokalisierung und Bereichssegmentierung

Lyu Pengyuan Yao Cong Wu Wenhao Yan Shuicheng Bai Xiang

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Mehrfachorientierte Erkennung von Szenentexten durch Eckenlokalisierung und Bereichssegmentierung

Lyu Pengyuan Yao Cong Wu Wenhao Yan Shuicheng Bai Xiang

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Mehrfachorientierte Erkennung von Szenentexten durch Eckenlokalisierung und Bereichssegmentierung

Lyu Pengyuan Yao Cong Wu Wenhao Yan Shuicheng Bai Xiang

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters