مجموعة بيانات وصف الصورة وترجمة فقرة الصورة
التاريخ
منذ 3 أعوام
رابط النشر
الترخيص
其他
الفئات

يمكن استخدام مجموعة بيانات ترجمة فقرات الصور لتقييم مقتطفات الوصف التي تم إنشاؤها للصور. تحتوي مجموعة البيانات هذه على 19,561 صورة من مجموعة بيانات Visual Genome. كل صورة تحتوي على فقرة واحدة. تحتوي مجموعات التدريب/التقييم/الاختبار على 14,575 و2,487 و2,489 صورة على التوالي.
تحتوي كل صورة أيضًا على 50 وصفًا إقليميًا (عبارات تصف جزءًا محددًا من الصورة)، و35 كائنًا، و26 سمة، و21 علاقة، بالإضافة إلى 17 زوجًا من الأسئلة والأجوبة.