HyperAIHyperAI

Command Palette

Search for a command to run...

Total-Text: Ein umfassendes Datensatz für die Erkennung und Erkennung von Szenentext

Chng Chee Kheng Chan Chee Seng

Zusammenfassung

Trotz der hohen Relevanz von Text in Kurvenorientierung in realen Umgebungen existiert dieser Texttyp in gut anerkannten Datensätzen für Szenentext, wie beispielsweise ICDAR2013 und MSRA-TD500, nahezu gar nicht. Der Hauptzweck von Total-Text besteht darin, diese Lücke zu schließen und eine neue Forschungsrichtung für die Gemeinschaft der Szenentextanalyse zu fördern. Neben den klassischen horizontalen und mehrorientierten Texten zeichnet sich Total-Text durch gekrümmte Textorientierungen aus. Die Datensätze sind hinsichtlich der Orientierungen äußerst vielfältig, wobei mehr als die Hälfte der Bilder eine Kombination von mehr als zwei unterschiedlichen Orientierungen aufweist. Kürzlich haben neue Ansätze, die die Texterkennung als Segmentierungsaufgabe formulieren, ihre Wirksamkeit gegenüber mehrorientierten Texten unter Beweis gestellt. Um die Robustheit solcher Ansätze gegenüber gekrümmtem Text zu evaluieren, haben wir DeconvNet fine-tuned und es auf Total-Text evaluiert. Der Datensatz mit den entsprechenden Annotationen ist unter https://github.com/cs-chan/Total-Text-Dataset verfügbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp