Command Palette
Search for a command to run...
مجموعة بيانات الإجابة على الأسئلة المفتوحة VQA (الإصدار 2.0)
Date
Size
Publish URL
Paper URL
License
Other
VQA (v2.0)، واسمه الكامل هو Visual Question Answering (v2.0)، عبارة عن مجموعة بيانات مفتوحة للإجابة على الأسئلة مع شرح يدوي حول الصور. الإجابة على هذه الأسئلة تتطلب فهمًا معينًا للصور واللغة والفطرة السليمة.
مثال على الصورة:

تتضمن مجموعة البيانات ما يلي:
- 265,016 صورة (من مجموعات بيانات COCO والمشاهد المجردة)
- عدد الأسئلة لكل صورة أكبر من أو يساوي 3 (متوسط 5.4 سؤال)
- يحتوي كل سؤال على 10 حقائق أساسية
- كل سؤال له 3 إجابات معقولة (ولكن ليس بالضرورة صحيحة)
- مقاييس التقييم التلقائية
تم إصدار مجموعة بيانات VQA لأول مرة في أكتوبر 2015، وتم إصدار VQA v2.0 في أبريل 2017.هذه المجموعة من البيانات هي الإصدار v2.0.بالمقارنة مع VQA v1.0، فإن v2.0 يكمل كل سؤال بالصور لتقليل التحيز اللغوي.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.