HyperAI

مجموعة بيانات التعرف على النص TextOCR

التاريخ

منذ 3 أعوام

المؤسسة

رابط النشر

textvqa.org

الترخيص

CC BY 4.0

مساعدة التنزيل
特色图像

OCR تعني التعرف الضوئي على الحروف. TextOCR عبارة عن مجموعة بيانات تستخدم لاكتشاف النص والتعرف عليه في أي مشهد. يوفر TextOCR حوالي مليون تعليق لفظي عالي الجودة للصور في TextVQA، ويمكنه إجراء تفكير شامل للمهام اللاحقة مثل الإجابة على الأسئلة المرئية أو تسمية الصور.

تتضمن مجموعة البيانات ما يلي:

  • 28,134 صورة من مجموعة بيانات TextVQA
  • 903,096 كلمة نصية توضيحية للمشهد
  • في المتوسط، تحتوي كل صورة على 32 كلمة ذات صلة.