HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات معيارية للإجابة على الأسئلة المرئية COREVQA

Date

منذ 4 أشهر

Size

5.63 GB

Publish URL

www.kaggle.com

Paper URL

2507.13405

License

Apache 2.0

COREVQA هي مجموعة بيانات مرجعية للإجابة على الأسئلة المرئية أصدرها مركز أبحاث الذكاء الاصطناعي Algoverse في عام 2025. نتائج الورقة ذات الصلة هي COREVQA: معيار للإجابة على الأسئلة البصرية باستخدام الملاحظة الجماعية والاستدلال المنطقي، والذي يهدف إلى تقييم قدرة الاستدلال المنطقي لنماذج اللغة البصرية (VLMs) في مشاهد الحشود.

تحتوي هذه المجموعة من البيانات على 5,608 أزواج من الصور وجمل الصواب والخطأ. الصور مستمدة من مجموعة بيانات CrowdHuman. تُصوّر البيانات بشكل أساسي مشاهد ازدحام واقعية، مع التركيز على تحديات مثل الانسداد، وتغييرات المنظور، وتداخل الخلفية. تهدف هذه البيانات إلى تطوير قدرات الإدراك والاستدلال الدقيقة لدى الروبوتات البصرية في المواقف الاجتماعية المعقدة.

تتضمن البيانات ما يلي:

  • صورة المشهد (image_id)
  • بيان اللغة الطبيعية (السؤال)
  • العلامة الثنائية (الإجابة: صحيح / خطأ)

COREVQA.torrent
Seeding 1Downloading 0Completed 19Total Downloads 109
  • COREVQA/
    • README.md
      1.42 KB
    • README.txt
      2.85 KB
      • data/
        • COREVQA.zip
          5.63 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
مجموعة بيانات معيارية للإجابة على الأسئلة المرئية COREVQA | Datasets | HyperAI