مجموعة بيانات التعرف على النص TextOCR
التاريخ
منذ 3 أعوام
رابط النشر
الترخيص
CC BY 4.0
الفئات

OCR تعني التعرف الضوئي على الحروف. TextOCR عبارة عن مجموعة بيانات تستخدم لاكتشاف النص والتعرف عليه في أي مشهد. يوفر TextOCR حوالي مليون تعليق لفظي عالي الجودة للصور في TextVQA، ويمكنه إجراء تفكير شامل للمهام اللاحقة مثل الإجابة على الأسئلة المرئية أو تسمية الصور.
تتضمن مجموعة البيانات ما يلي:
- 28,134 صورة من مجموعة بيانات TextVQA
- 903,096 كلمة نصية توضيحية للمشهد
- في المتوسط، تحتوي كل صورة على 32 كلمة ذات صلة.