Ensemble De Données De Reconnaissance De Texte Manuscrit HKR
Date
URL de publication
URL de l'article
Licence
Autre

HKR signifie Handwritten Kazakh and Russian, qui est un ensemble de données tabulaires des langues russe et kazakhe (environ 95% de russe et 5% de kazakh) pour la reconnaissance de texte manuscrit hors ligne. Contient plus de 1 400 formulaires remplis, 63 000 phrases, plus de 715 699 caractères et 200 auteurs. Les tableaux ont été générés avec LATEX et leur contenu a été écrit par les auteurs. L'ensemble de données est écrit en cyrillique et partage 33 caractères identiques. En plus de ces caractères, l'alphabet de la langue kazakhe contient 9 caractères spéciaux supplémentaires.
L'ensemble de données comprend :
- Exemples/tableaux manuscrits de mots-clés en kazakh et en russe (région, ville, village, etc.)
- Exemples d'écriture russe et kazakhe en cyrillique
- Exemple/formulaire d'écriture pour la poésie russe
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.