HyperAI

مجموعة بيانات التعرف على النصوص المكتوبة بخط اليد في هونج كونج

مساعدة التنزيل
特色图像

HKR تعني Handwritten Kazakh and Russian، وهي مجموعة بيانات جدولية للغات الروسية والكازاخستانية (حوالي 95% من الروسية و5% من الكازاخستانية) للتعرف على النصوص المكتوبة بخط اليد دون اتصال بالإنترنت. يحتوي على أكثر من 1400 نموذج مكتمل، و63000 جملة، وأكثر من 715699 حرفًا، و200 مؤلف. تم إنشاء الجداول باستخدام LATEX وتم كتابة محتوياتها بواسطة المؤلفين. تمت كتابة مجموعة البيانات باللغة السيريلية وتشترك في 33 حرفًا متطابقًا. بالإضافة إلى هذه الأحرف، يحتوي أبجدية اللغة الكازاخستانية على 9 أحرف خاصة إضافية.

تتضمن مجموعة البيانات ما يلي:

  • عينات/جداول مكتوبة بخط اليد للكلمات الرئيسية باللغتين الكازاخستانية والروسية (المنطقة، المدينة، القرية، إلخ.)
  • عينات روسية وكازاخية بخط اليد السيريلي
  • نموذج/نموذج خط اليد للشعر الروسي