مجموعة بيانات الإجابة على الأسئلة المفتوحة VQA (الإصدار 2.0)
التاريخ
منذ 3 أعوام
الحجم
12.01 GB
رابط النشر
الترخيص
其他
VQA (v2.0)، واسمه الكامل هو Visual Question Answering (v2.0)، عبارة عن مجموعة بيانات مفتوحة للإجابة على الأسئلة مع شرح يدوي حول الصور. الإجابة على هذه الأسئلة تتطلب فهمًا معينًا للصور واللغة والفطرة السليمة.
مثال على الصورة:

تتضمن مجموعة البيانات ما يلي:
- 265,016 صورة (من مجموعات بيانات COCO والمشاهد المجردة)
- عدد الأسئلة لكل صورة أكبر من أو يساوي 3 (متوسط 5.4 سؤال)
- يحتوي كل سؤال على 10 حقائق أساسية
- كل سؤال له 3 إجابات معقولة (ولكن ليس بالضرورة صحيحة)
- مقاييس التقييم التلقائية
تم إصدار مجموعة بيانات VQA لأول مرة في أكتوبر 2015، وتم إصدار VQA v2.0 في أبريل 2017.هذه المجموعة من البيانات هي الإصدار v2.0.بالمقارنة مع VQA v1.0، فإن v2.0 يكمل كل سؤال بالصور لتقليل التحيز اللغوي.
Visual_Question_Answering_(VQA).torrent
البذر 1التنزيل 1مكتمل 570إجمالي التنزيلات 1,327