التاريخ

منذ 4 أعوام

الحجم

1.86 GB

المؤسسة

عنوان URL للنشر

visualdialog.org

رابط الورقة البحثية

arxiv.org

الترخيص

CC BY 4.0

الوسوم

متعدد الوسائط

التعلم العميق

الإجابة على الأسئلة البصرية

فهم الصور

VisDial، الاسم الكامل لـ Visual Dialog، عبارة عن مجموعة بيانات تحتوي على مشكلات التعليقات التوضيحية اليدوية استنادًا إلى الصور من مجموعة بيانات MS COCO. تم تطوير مجموعة البيانات من خلال جعل شخصين يتحدثان عن صورة على Amazon Mechanical Turk. أحدهما يتصرف كسائل والآخر يتصرف كمجيب. لا يمكن للسائل رؤية سوى وصف النص الخاص بالصورة (أي عنوان الصورة من مجموعة بيانات MS COCO)، ولا يمكن للسائل رؤية الصورة الأصلية. وكانت مهمتهم طرح الأسئلة حول هذه الصورة من أجل "تصور المشهد بشكل أفضل". يرى المستفتى الصورة والتسمية التوضيحية ويجيب على السؤال الذي طرحه السائل. يمكن لكليهما مواصلة المحادثة عن طريق طرح الأسئلة والإجابة عليها، لمدة تصل إلى 10 جولات. يتضمن VisDial v1.0 ما يلي:

مجموعة التدريب: 1,23,287 صورة، 10 جولات حوار لكل صورة؛
مجموعة التحقق: 2064 صورة، 10 جولات حوار لكل صورة؛
مجموعة الاختبار: 8000 صورة، دورة واحدة من الحوار لكل صورة.

VisDial.torrent

البذر 2جارٍ التنزيل 0مكتمل 620إجمالي التنزيلات 794

VisDial/
- README.md
  1.58 KB
- README.txt
  3.15 KB

تم المساهمة بهذه المجموعة من البيانات من قبل مستخدمي المجتمع وهي مخصصة للأغراض التعليمية والإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

مجموعات البيانات ذات الصلة

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار