HyperAI

مجموعة بيانات وصف الصورة وترجمة فقرة الصورة

التاريخ

منذ 3 أعوام

المؤسسة

جامعة ستانفورد

رابط النشر

cs.stanford.edu

الترخيص

其他

مساعدة التنزيل
特色图像

يمكن استخدام مجموعة بيانات ترجمة فقرات الصور لتقييم مقتطفات الوصف التي تم إنشاؤها للصور. تحتوي مجموعة البيانات هذه على 19,561 صورة من مجموعة بيانات Visual Genome. كل صورة تحتوي على فقرة واحدة. تحتوي مجموعات التدريب/التقييم/الاختبار على 14,575 و2,487 و2,489 صورة على التوالي.

تحتوي كل صورة أيضًا على 50 وصفًا إقليميًا (عبارات تصف جزءًا محددًا من الصورة)، و35 كائنًا، و26 سمة، و21 علاقة، بالإضافة إلى 17 زوجًا من الأسئلة والأجوبة.