vor 7 Monaten

Zusammenfassung

Neuronale Netzwerke basierte Methoden zur Erkennung von Szene-Texten sind kürzlich aufgetreten und haben vielversprechende Ergebnisse gezeigt. Frühere Methoden, die mit starr definierten Wort-Level-Bounding-Boxen trainiert wurden, zeigen Einschränkungen bei der Darstellung von Textbereichen in beliebigen Formen. In dieser Arbeit schlagen wir eine neue Methode zur Erkennung von Szene-Texten vor, die durch die Untersuchung jedes einzelnen Zeichens und der Affinität zwischen Zeichen effektiv Textbereiche erkennt. Um das Fehlen von individuellen Zeichen-Level-Annotierungen zu überwinden, nutzt unser vorgeschlagener Framework sowohl die gegebenen Zeichen-Level-Annotierungen für synthetische Bilder als auch die geschätzten Zeichen-Level-Ground-Truths für reale Bilder, die durch das gelernte Interimsmodell erworben werden. Um die Affinität zwischen den Zeichen abzuschätzen, wird das Netzwerk mit der neu vorgeschlagenen Darstellung für Affinität trainiert. Ausführliche Experimente an sechs Benchmarks, darunter die Datasets TotalText und CTW-1500, die hoch gekrümmte Texte in natürlichen Bildern enthalten, zeigen, dass unsere zeichenbasierte Texterkennung deutlich besser als die besten bisher bekannten Detektoren abschneidet. Die Ergebnisse garantieren eine hohe Flexibilität bei der Erkennung komplexer Szene-Textbilder, wie z.B. willkürlich orientierter, gekrümmter oder deformierter Texte.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 7 Monaten

Objekterkennung

Faltungsneuronales Netzwerk

Semantische Segmentierung

Ansatz/Rahmenwerk

Computervision

Aufgabe

Youngmin Baek Bado Lee Dongyoon Han Sangdoo Yun Hwalsuk Lee

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 7 Monaten

Objekterkennung

Faltungsneuronales Netzwerk

Semantische Segmentierung

Ansatz/Rahmenwerk

Computervision

Aufgabe

Youngmin Baek Bado Lee Dongyoon Han Sangdoo Yun Hwalsuk Lee

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Bewusstsein für Zeichenregionen bei der Texterkennung | Paper | HyperAI

Command Palette

Bewusstsein für Zeichenregionen bei der Texterkennung

Youngmin Baek Bado Lee Dongyoon Han Sangdoo Yun Hwalsuk Lee

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Bewusstsein für Zeichenregionen bei der Texterkennung

Youngmin Baek Bado Lee Dongyoon Han Sangdoo Yun Hwalsuk Lee

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Bewusstsein für Zeichenregionen bei der Texterkennung

Youngmin Baek Bado Lee Dongyoon Han Sangdoo Yun Hwalsuk Lee

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters