مجموعة بيانات الاستدلال الحسي البصري لأجهزة تسجيل الفيديو
التاريخ
الحجم
رابط النشر
رابط الورقة البحثية
الترخيص
أخرى

VCR تعني Visual Commonsense Reasoning، وهي مجموعة بيانات واسعة النطاق للتفكير السليم البصري. تطرح مجموعة البيانات أسئلة صعبة حول الصور، وتحتاج الآلة إلى إكمال مهمتين فرعيتين: الإجابة على السؤال بشكل صحيح وتقديم أسباب لتبرير إجابتها.
تحتوي مجموعة بيانات VCR على عدد كبير من الأسئلة، منها 212 ألف سؤال تُستخدم للتدريب، و26 ألف سؤال للتحقق، و25 ألف سؤال للاختبار. الإجابات والأسباب تأتي من أكثر من 110 ألف مشهد سينمائي فريد.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.