HyperAIHyperAI

Command Palette

Search for a command to run...

Chinesischer Text in Der Wildnis – Datensatz Chinesischer Zeichen

Datum

vor 3 Jahren

Organisation

Tsinghua-Universität

Veröffentlichungs-URL

ctwdataset.github.io

Paper-URL

arxiv.org

Lizenz

Andere

Treten Sie der Discord-Community bei
Featured Image

„Chinese Text in the Wild“ ist ein großer Datensatz, der aus Texten in natürlichen Bildern erstellt wurde. Dieser Datensatz enthält 32.285 Bilder mit 1.018.402 chinesischen Schriftzeichen und übertrifft damit frühere Datensätze bei weitem. Diese Bilder stammen von Tencent Street View und wurden ohne besonderen Zweck aus Dutzenden verschiedener Städte in China bezogen.

Dieser Datensatz stellt aufgrund seiner Vielfalt und Komplexität eine große Herausforderung dar. Es enthält flachen Text, erhabenen Text, städtischen Text, ländlichen Text, Text mit geringer Helligkeit, entfernten Text, teilweise verdeckten Text usw.

Zu jedem Bild sind alle chinesischen Schriftzeichen von Experten kommentiert. Für jedes chinesische Schriftzeichen versieht der Datensatz das zugrunde liegende Zeichen, den Begrenzungsrahmen und 6 Attribute mit Anmerkungen, um anzugeben, ob es verdeckt ist, einen komplexen Hintergrund hat, verzerrt ist, ein 3D-Text ist, künstlerisch ist oder handgeschrieben ist.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Chinesischer Text in Der Wildnis – Datensatz Chinesischer Zeichen | Datensätze | HyperAI