التاريخ

منذ 4 أعوام

الحجم

91.41 MB

المؤسسة

عنوان URL للنشر

github.com

رابط الورقة البحثية

arxiv.org

الترخيص

Other

الوسوم

توليد النص

الإجابة على الأسئلة البصرية

فهم الصور

تمثيل متعدد الوسائط

VQA-E تعني الإجابة المرئية على الأسئلة مع التوضيح. إنها مجموعة بيانات للإجابة على الأسئلة المرئية مع التوضيح. يجب أن يكون النموذج المعني قادرًا على التنبؤ وتوليد تفسيرات للإجابات. يتم تصنيعها بواسطة مجموعة بيانات VQA v2يتم استخلاص تحليل نصي تلقائيًا لكل "ثلاثية صورة-سؤال-إجابة"، مما يجعل عملية الإجابة على السؤال أسهل للفهم والتتبع.

VQA-E.torrent

البذر 2جارٍ التنزيل 0مكتمل 754إجمالي التنزيلات 544

VQA-E/
- README.md
  1.07 KB
- README.txt
  2.14 KB

تم المساهمة بهذه المجموعة من البيانات من قبل مستخدمي المجتمع وهي مخصصة للأغراض التعليمية والإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

مجموعات البيانات ذات الصلة

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار