مجموعة بيانات معيارية للتعرف على النصوص OCRBench-v2
OCRBench-v2 هو معيار تقييمي متعدد الوسائط لنموذج واسع النطاق للتعرف الضوئي على الحروف (OCR)، أصدرته جامعة هواتشونغ للعلوم والتكنولوجيا، وجامعة جنوب الصين للتكنولوجيا، وشركة بايت دانس، ومؤسسات أخرى في عام ٢٠٢٥. نتائج البحث ذات الصلة هي:OCRBench v2: معيار مُحسّن لتقييم نماذج الوسائط المتعددة الكبيرة في توطين النصوص البصرية والاستدلال عليها"، والذي يهدف إلى تقييم قدرات التعرف الضوئي على الحروف (OCR) للنماذج متعددة الوسائط الكبيرة (LMMs) في المهام المختلفة المتعلقة بالنصوص.
هذه المجموعة من البيانات هي تحديث واسع النطاق قائم على OCRBench. تتضمن 10,000 زوج من الأسئلة والأجوبة باللغتين الصينية والإنجليزية، مُتحقق منها يدويًا، كمجموعة اختبار عامة، ومجموعة اختبار خاصة إضافية تتكون من 1,500 صورة نصية غنية مُعلّق عليها يدويًا، من مصادر متنوعة، بما في ذلك الكتب المطبوعة والإلكترونية والمستندات الممسوحة ضوئيًا ومحتوى الويب. تغطي البيانات 31 سيناريو نصيًا نموذجيًا و23 مهمة فرعية، مُصنّفة إلى ثماني وظائف أساسية للتعرف الضوئي على الحروف (OCR) (التعرف على النصوص، والكشف عن النصوص، وتحديد موقع مرجع النص، واستخراج العلاقات، وتحليل العناصر، والعمليات الرياضية، وفهم النص المرئي، والاستدلال المعرفي).
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.