HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات معيارية للإجابة على الأسئلة المرئية COREVQA

التاريخ

منذ 6 أشهر

الحجم

5.63 GB

عنوان URL للنشر

www.kaggle.com

رابط الورقة البحثية

2507.13405

الترخيص

Apache 2.0

الوسوم

COREVQA هي مجموعة بيانات مرجعية للإجابة على الأسئلة المرئية أصدرها مركز أبحاث الذكاء الاصطناعي Algoverse في عام 2025. نتائج الورقة ذات الصلة هي COREVQA: معيار للإجابة على الأسئلة البصرية باستخدام الملاحظة الجماعية والاستدلال المنطقي، والذي يهدف إلى تقييم قدرة الاستدلال المنطقي لنماذج اللغة البصرية (VLMs) في مشاهد الحشود.

تحتوي هذه المجموعة من البيانات على 5,608 أزواج من الصور وجمل الصواب والخطأ. الصور مستمدة من مجموعة بيانات CrowdHuman. تُصوّر البيانات بشكل أساسي مشاهد ازدحام واقعية، مع التركيز على تحديات مثل الانسداد، وتغييرات المنظور، وتداخل الخلفية. تهدف هذه البيانات إلى تطوير قدرات الإدراك والاستدلال الدقيقة لدى الروبوتات البصرية في المواقف الاجتماعية المعقدة.

تتضمن البيانات ما يلي:

  • صورة المشهد (image_id)
  • بيان اللغة الطبيعية (السؤال)
  • العلامة الثنائية (الإجابة: صحيح / خطأ)

COREVQA.torrent
البذر 1جارٍ التنزيل 0مكتمل 31إجمالي التنزيلات 123
  • COREVQA/
    • README.md
      1.42 KB
    • README.txt
      2.85 KB
      • data/
        • COREVQA.zip
          5.63 GB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp