Command Palette
Search for a command to run...
مجموعة بيانات التعرف على النص TextOCR
Date
Publish URL
Paper URL
License
CC BY 4.0

OCR تعني التعرف الضوئي على الحروف. TextOCR عبارة عن مجموعة بيانات تستخدم لاكتشاف النص والتعرف عليه في أي مشهد. يوفر TextOCR حوالي مليون تعليق لفظي عالي الجودة للصور في TextVQA، ويمكنه إجراء تفكير شامل للمهام اللاحقة مثل الإجابة على الأسئلة المرئية أو تسمية الصور.
تتضمن مجموعة البيانات ما يلي:
- 28,134 صورة من مجموعة بيانات TextVQA
- 903,096 كلمة نصية توضيحية للمشهد
- في المتوسط، تحتوي كل صورة على 32 كلمة ذات صلة.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.