HyperAIHyperAI

Command Palette

Search for a command to run...

Chinesischer Text in Der Wildnis – Datensatz Chinesischer Zeichen

Discuss on Discord

Date

vor 3 Jahren

Organization

Tsinghua-Universität

Paper URL

arxiv.org

License

Other

Featured Image

„Chinese Text in the Wild“ ist ein großer Datensatz, der aus Texten in natürlichen Bildern erstellt wurde. Dieser Datensatz enthält 32.285 Bilder mit 1.018.402 chinesischen Schriftzeichen und übertrifft damit frühere Datensätze bei weitem. Diese Bilder stammen von Tencent Street View und wurden ohne besonderen Zweck aus Dutzenden verschiedener Städte in China bezogen.

Dieser Datensatz stellt aufgrund seiner Vielfalt und Komplexität eine große Herausforderung dar. Es enthält flachen Text, erhabenen Text, städtischen Text, ländlichen Text, Text mit geringer Helligkeit, entfernten Text, teilweise verdeckten Text usw.

Zu jedem Bild sind alle chinesischen Schriftzeichen von Experten kommentiert. Für jedes chinesische Schriftzeichen versieht der Datensatz das zugrunde liegende Zeichen, den Begrenzungsrahmen und 6 Attribute mit Anmerkungen, um anzugeben, ob es verdeckt ist, einen komplexen Hintergrund hat, verzerrt ist, ein 3D-Text ist, künstlerisch ist oder handgeschrieben ist.

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp