Ensemble De Données De Reconnaissance De Texte Manuscrit HKR
Date
il y a 3 ans
URL de publication
Licence
其他
Tags
Catégories

HKR signifie Handwritten Kazakh and Russian, qui est un ensemble de données tabulaires des langues russe et kazakhe (environ 95% de russe et 5% de kazakh) pour la reconnaissance de texte manuscrit hors ligne. Contient plus de 1 400 formulaires remplis, 63 000 phrases, plus de 715 699 caractères et 200 auteurs. Les tableaux ont été générés avec LATEX et leur contenu a été écrit par les auteurs. L'ensemble de données est écrit en cyrillique et partage 33 caractères identiques. En plus de ces caractères, l'alphabet de la langue kazakhe contient 9 caractères spéciaux supplémentaires.
L'ensemble de données comprend :
- Exemples/tableaux manuscrits de mots-clés en kazakh et en russe (région, ville, village, etc.)
- Exemples d'écriture russe et kazakhe en cyrillique
- Exemple/formulaire d'écriture pour la poésie russe