HyperAI

Ensemble De Données De Reconnaissance De Texte Manuscrit HKR

Aide au téléchargement
特色图像

HKR signifie Handwritten Kazakh and Russian, qui est un ensemble de données tabulaires des langues russe et kazakhe (environ 95% de russe et 5% de kazakh) pour la reconnaissance de texte manuscrit hors ligne. Contient plus de 1 400 formulaires remplis, 63 000 phrases, plus de 715 699 caractères et 200 auteurs. Les tableaux ont été générés avec LATEX et leur contenu a été écrit par les auteurs. L'ensemble de données est écrit en cyrillique et partage 33 caractères identiques. En plus de ces caractères, l'alphabet de la langue kazakhe contient 9 caractères spéciaux supplémentaires.

L'ensemble de données comprend :

  • Exemples/tableaux manuscrits de mots-clés en kazakh et en russe (région, ville, village, etc.)
  • Exemples d'écriture russe et kazakhe en cyrillique
  • Exemple/formulaire d'écriture pour la poésie russe