vor 8 Monaten

Zusammenfassung

Getrieben von tiefen neuronalen Netzen und großen Datensätzen haben Methoden zur Erkennung von Szene-Text in den letzten Jahren erhebliche Fortschritte gemacht und die Leistungsrekorde auf verschiedenen Standard-Benchmarks kontinuierlich verbessert. Allerdings können bestehende Methoden, die auf begrenzten Repräsentationen (achsenparallele Rechtecke, gedrehte Rechtecke oder Vierecke) basieren, um Text zu beschreiben, bei der Verarbeitung viel freierer Textinstanzen wie gekrümmtem Text, der in realen Szenarien tatsächlich sehr häufig vorkommt, möglicherweise versagen. Um dieses Problem zu lösen, schlagen wir eine flexiblere Repräsentation für Szene-Text vor, die als TextSnake bezeichnet wird und in der Lage ist, Textinstanzen in horizontaler, orientierter und gekrümmter Form effektiv darzustellen. In TextSnake wird eine Textinstanz als eine Folge geordneter, sich überlappender Scheiben entlang symmetrischer Achsen beschrieben, wobei jeder Scheibe ein potentiell variabler Radius und eine Orientierung zugeordnet sind. Diese geometrischen Attribute werden durch ein Fully Convolutional Network (FCN)-Modell geschätzt. In Experimenten erreicht der Textdetektor basierend auf TextSnake Stand-of-the-Art- oder vergleichbare Leistungen auf Total-Text und SCUT-CTW1500, zwei neu veröffentlichten Benchmarks mit besonderem Fokus auf gekrümmten Text in natürlichen Bildern, sowie auf den weit verbreiteten Datensätzen ICDAR 2015 und MSRA-TD500. Insbesondere übertreffen die Ergebnisse von TextSnake das Baseline-Modell auf Total-Text um mehr als 40% im F-Maß.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 8 Monaten

Objekterkennung

Faltungsneuronales Netzwerk

Shangbang Long Jiaqiang Ruan Wenjie Zhang Xin He Wenhao Wu Cong Yao

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 8 Monaten

Objekterkennung

Faltungsneuronales Netzwerk

Shangbang Long Jiaqiang Ruan Wenjie Zhang Xin He Wenhao Wu Cong Yao

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

TextSnake: Eine flexible Darstellung zur Erkennung von Text in beliebigen Formen | Paper | HyperAI

Command Palette

TextSnake: Eine flexible Darstellung zur Erkennung von Text in beliebigen Formen

Shangbang Long Jiaqiang Ruan Wenjie Zhang Xin He Wenhao Wu Cong Yao

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

TextSnake: Eine flexible Darstellung zur Erkennung von Text in beliebigen Formen

Shangbang Long Jiaqiang Ruan Wenjie Zhang Xin He Wenhao Wu Cong Yao

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

TextSnake: Eine flexible Darstellung zur Erkennung von Text in beliebigen Formen

Shangbang Long Jiaqiang Ruan Wenjie Zhang Xin He Wenhao Wu Cong Yao

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters