HKR-Datensatz Zur Handschriftlichen Texterkennung
Datum
vor 3 Jahren
Veröffentlichungs-URL
Lizenz
其他
Kategorien

HKR steht für Handwritten Kazakh and Russian und ist ein tabellarischer Datensatz der russischen und kasachischen Sprachen (ca. 95% Russisch und 5% Kasachisch) für die Offline-Erkennung handschriftlicher Texte. Enthält über 1.400 ausgefüllte Formulare, 63.000 Sätze, über 715.699 Zeichen und 200 Autoren. Die Tabellen wurden mit LATEX erstellt und ihre Inhalte von den Autoren verfasst. Der Datensatz ist in kyrillischer Sprache verfasst und enthält 33 identische Zeichen. Zusätzlich zu diesen Zeichen enthält das Alphabet der kasachischen Sprache 9 weitere Sonderzeichen.
Der Datensatz umfasst:
- Handschriftliche Beispiele/Tabellen mit Schlüsselwörtern auf Kasachisch und Russisch (Region, Stadt, Dorf usw.)
- Russische und kasachische Beispiele in kyrillischer Handschrift
- Handschriftprobe/Formular für russische Poesie