Command Palette
Search for a command to run...
مجموعة بيانات التعرف على النص TextOCR
التاريخ
عنوان URL للنشر
رابط الورقة البحثية
الترخيص
CC BY 4.0

OCR تعني التعرف الضوئي على الحروف. TextOCR عبارة عن مجموعة بيانات تستخدم لاكتشاف النص والتعرف عليه في أي مشهد. يوفر TextOCR حوالي مليون تعليق لفظي عالي الجودة للصور في TextVQA، ويمكنه إجراء تفكير شامل للمهام اللاحقة مثل الإجابة على الأسئلة المرئية أو تسمية الصور.
تتضمن مجموعة البيانات ما يلي:
- 28,134 صورة من مجموعة بيانات TextVQA
- 903,096 كلمة نصية توضيحية للمشهد
- في المتوسط، تحتوي كل صورة على 32 كلمة ذات صلة.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.