HyperAIHyperAI

Command Palette

Search for a command to run...

TextSnake: Eine flexible Darstellung zur Erkennung von Text in beliebigen Formen

Shangbang Long Jiaqiang Ruan Wenjie Zhang Xin He Wenhao Wu Cong Yao

Zusammenfassung

Getrieben von tiefen neuronalen Netzen und großen Datensätzen haben Methoden zur Erkennung von Szene-Text in den letzten Jahren erhebliche Fortschritte gemacht und die Leistungsrekorde auf verschiedenen Standard-Benchmarks kontinuierlich verbessert. Allerdings können bestehende Methoden, die auf begrenzten Repräsentationen (achsenparallele Rechtecke, gedrehte Rechtecke oder Vierecke) basieren, um Text zu beschreiben, bei der Verarbeitung viel freierer Textinstanzen wie gekrümmtem Text, der in realen Szenarien tatsächlich sehr häufig vorkommt, möglicherweise versagen. Um dieses Problem zu lösen, schlagen wir eine flexiblere Repräsentation für Szene-Text vor, die als TextSnake bezeichnet wird und in der Lage ist, Textinstanzen in horizontaler, orientierter und gekrümmter Form effektiv darzustellen. In TextSnake wird eine Textinstanz als eine Folge geordneter, sich überlappender Scheiben entlang symmetrischer Achsen beschrieben, wobei jeder Scheibe ein potentiell variabler Radius und eine Orientierung zugeordnet sind. Diese geometrischen Attribute werden durch ein Fully Convolutional Network (FCN)-Modell geschätzt. In Experimenten erreicht der Textdetektor basierend auf TextSnake Stand-of-the-Art- oder vergleichbare Leistungen auf Total-Text und SCUT-CTW1500, zwei neu veröffentlichten Benchmarks mit besonderem Fokus auf gekrümmten Text in natürlichen Bildern, sowie auf den weit verbreiteten Datensätzen ICDAR 2015 und MSRA-TD500. Insbesondere übertreffen die Ergebnisse von TextSnake das Baseline-Modell auf Total-Text um mehr als 40% im F-Maß.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
TextSnake: Eine flexible Darstellung zur Erkennung von Text in beliebigen Formen | Paper | HyperAI