HKR-Datensatz Zur Handschriftlichen Texterkennung
Datum
Veröffentlichungs-URL
Paper-URL
Lizenz
Andere

HKR steht für Handwritten Kazakh and Russian und ist ein tabellarischer Datensatz der russischen und kasachischen Sprachen (ca. 95% Russisch und 5% Kasachisch) für die Offline-Erkennung handschriftlicher Texte. Enthält über 1.400 ausgefüllte Formulare, 63.000 Sätze, über 715.699 Zeichen und 200 Autoren. Die Tabellen wurden mit LATEX erstellt und ihre Inhalte von den Autoren verfasst. Der Datensatz ist in kyrillischer Sprache verfasst und enthält 33 identische Zeichen. Zusätzlich zu diesen Zeichen enthält das Alphabet der kasachischen Sprache 9 weitere Sonderzeichen.
Der Datensatz umfasst:
- Handschriftliche Beispiele/Tabellen mit Schlüsselwörtern auf Kasachisch und Russisch (Region, Stadt, Dorf usw.)
- Russische und kasachische Beispiele in kyrillischer Handschrift
- Handschriftprobe/Formular für russische Poesie
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.