HyperAI

مجموعة بيانات الإجابة على الأسئلة المرئية VQA

التاريخ

منذ عام واحد

الحجم

58.91 MB

المؤسسة

الترخيص

其他

تأتي هذه المجموعة من البيانات من جامعة ولاية كامبيناس قاعدة المعرفة الموضوعية MO434.

مقدمة

هذا تطبيق Flask بسيط يقوم بإنشاء إجابات بناءً على صورة وأسئلة باللغة الطبيعية حول الصورة. يستخدم التطبيق نموذج التعلم العميق الذي تم تدريبه باستخدام TensorFlow خلف الكواليس.

نظرة عامة على النموذج

لقد ساهم تطوير التعلم العميق في تعزيز حل المهام المتعلقة بالتعلم المتعدد الوسائط. الإجابة على الأسئلة المرئية (VQA) هي مثال صعب للغاية، ويتطلب تفسير المشهد على مستوى عالٍ من خلال الصور ونمذجة لغة الإجابة على الأسئلة ذات الصلة. بالنظر إلى صورة وسؤال باللغة الطبيعية حول الصورة، فإن المهمة هي تقديم إجابة دقيقة باللغة الطبيعية. هذا هو نظام متكامل تم تنفيذه باستخدام Keras بهدف إنجاز هذه المهمة.

نموذج معماري مبني على الورقة الاهتمام المشترك بالسؤال الهرمي والصورة للإجابة على الأسئلة البصرية .

VQA.torrent
البذر 1التنزيل 1مكتمل 118إجمالي التنزيلات 294
  • VQA/
    • README.md
      1.56 KB
    • README.txt
      3.12 KB
      • data/
        • LICENSE
          4.16 KB
        • README.md
          8.21 KB
        • main.py
          11.21 KB
          • models/
              • __pycache__/
                • arch.cpython-36.pyc
                  13.8 KB
                • layers.cpython-36.pyc
                  20.06 KB
            • arch.py
              23.74 KB
            • layers.py
              31.9 KB
          • pickles/
            • complete_model.h5
              58.23 MB
            • labelencoder.pkl
              58.3 MB
            • text_tokenizer.pkl
              58.88 MB
        • related-work.md
          58.88 MB
        • requirements.txt
          58.88 MB
          • static/
            • stop_grande.jpg
              58.89 MB
          • templates/
            • error.html
              58.89 MB
            • index.html
              58.9 MB
          • utils/
              • __pycache__/
                • helper_functions.cpython-36.pyc
                  58.9 MB
                • load_pickles.cpython-36.pyc
                  58.9 MB
            • helper_functions.py
              58.91 MB
            • load_pickles.py
              58.91 MB