Command Palette
Search for a command to run...
Total-Text: Ein umfassendes Datensatz für die Erkennung und Erkennung von Szenentext
Total-Text: Ein umfassendes Datensatz für die Erkennung und Erkennung von Szenentext
Chng Chee Kheng Chan Chee Seng
Zusammenfassung
Trotz der hohen Relevanz von Text in Kurvenorientierung in realen Umgebungen existiert dieser Texttyp in gut anerkannten Datensätzen für Szenentext, wie beispielsweise ICDAR2013 und MSRA-TD500, nahezu gar nicht. Der Hauptzweck von Total-Text besteht darin, diese Lücke zu schließen und eine neue Forschungsrichtung für die Gemeinschaft der Szenentextanalyse zu fördern. Neben den klassischen horizontalen und mehrorientierten Texten zeichnet sich Total-Text durch gekrümmte Textorientierungen aus. Die Datensätze sind hinsichtlich der Orientierungen äußerst vielfältig, wobei mehr als die Hälfte der Bilder eine Kombination von mehr als zwei unterschiedlichen Orientierungen aufweist. Kürzlich haben neue Ansätze, die die Texterkennung als Segmentierungsaufgabe formulieren, ihre Wirksamkeit gegenüber mehrorientierten Texten unter Beweis gestellt. Um die Robustheit solcher Ansätze gegenüber gekrümmtem Text zu evaluieren, haben wir DeconvNet fine-tuned und es auf Total-Text evaluiert. Der Datensatz mit den entsprechenden Annotationen ist unter https://github.com/cs-chan/Total-Text-Dataset verfügbar.