Command Palette
Search for a command to run...
مجموعة بيانات الإجابة على الأسئلة المفتوحة VQA (الإصدار 2.0)
التاريخ
الحجم
عنوان URL للنشر
رابط الورقة البحثية
الترخيص
Other
VQA (v2.0)، واسمه الكامل هو Visual Question Answering (v2.0)، عبارة عن مجموعة بيانات مفتوحة للإجابة على الأسئلة مع شرح يدوي حول الصور. الإجابة على هذه الأسئلة تتطلب فهمًا معينًا للصور واللغة والفطرة السليمة.
مثال على الصورة:

تتضمن مجموعة البيانات ما يلي:
- 265,016 صورة (من مجموعات بيانات COCO والمشاهد المجردة)
- عدد الأسئلة لكل صورة أكبر من أو يساوي 3 (متوسط 5.4 سؤال)
- يحتوي كل سؤال على 10 حقائق أساسية
- كل سؤال له 3 إجابات معقولة (ولكن ليس بالضرورة صحيحة)
- مقاييس التقييم التلقائية
تم إصدار مجموعة بيانات VQA لأول مرة في أكتوبر 2015، وتم إصدار VQA v2.0 في أبريل 2017.هذه المجموعة من البيانات هي الإصدار v2.0.بالمقارنة مع VQA v1.0، فإن v2.0 يكمل كل سؤال بالصور لتقليل التحيز اللغوي.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.