HyperAI

مجموعة بيانات تحليل الإجابة على الأسئلة المرئية VQA-E

التاريخ

منذ 3 أعوام

الحجم

91.41 MB

المؤسسة

جامعة العلوم والتكنولوجيا في الصين

رابط النشر

github.com

الترخيص

其他

特色图像

VQA-E تعني الإجابة المرئية على الأسئلة مع التوضيح. إنها مجموعة بيانات للإجابة على الأسئلة المرئية مع التوضيح. يجب أن يكون النموذج المعني قادرًا على التنبؤ وتوليد تفسيرات للإجابات. يتم تصنيعها بواسطة مجموعة بيانات VQA v2يتم استخلاص تحليل نصي تلقائيًا لكل "ثلاثية صورة-سؤال-إجابة"، مما يجعل عملية الإجابة على السؤال أسهل للفهم والتتبع.

VQA-E.torrent
البذر 1التنزيل 1مكتمل 546إجمالي التنزيلات 365
  • VQA-E/
    • README.md
      1.07 KB
    • README.txt
      2.14 KB
      • data/
        • VQA-E_train_set.json
          61.41 MB
        • VQA-E_val_set.json
          91.41 MB