HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات الإجابة على الأسئلة المرئية VQA

التاريخ

منذ 2 أعوام

الحجم

58.91 MB

المؤسسة

رابط الورقة البحثية

arxiv.org

الترخيص

أخرى

العلامات

تأتي هذه المجموعة من البيانات من جامعة ولاية كامبيناس قاعدة المعرفة الموضوعية MO434.

مقدمة

هذا تطبيق Flask بسيط يقوم بإنشاء إجابات بناءً على صورة وأسئلة باللغة الطبيعية حول الصورة. يستخدم التطبيق نموذج التعلم العميق الذي تم تدريبه باستخدام TensorFlow خلف الكواليس.

نظرة عامة على النموذج

لقد ساهم تطوير التعلم العميق في تعزيز حل المهام المتعلقة بالتعلم المتعدد الوسائط. الإجابة على الأسئلة المرئية (VQA) هي مثال صعب للغاية، ويتطلب تفسير المشهد على مستوى عالٍ من خلال الصور ونمذجة لغة الإجابة على الأسئلة ذات الصلة. بالنظر إلى صورة وسؤال باللغة الطبيعية حول الصورة، فإن المهمة هي تقديم إجابة دقيقة باللغة الطبيعية. هذا هو نظام متكامل تم تنفيذه باستخدام Keras بهدف إنجاز هذه المهمة.

نموذج معماري مبني على الورقة الاهتمام المشترك بالسؤال الهرمي والصورة للإجابة على الأسئلة البصرية .

VQA.torrent
البذر 3التنزيل 0مكتمل 216إجمالي التنزيلات 416
  • VQA/
    • README.md
      1.56 KB
    • README.txt
      3.12 KB
      • data/
        • LICENSE
          4.16 KB
        • README.md
          8.21 KB
        • main.py
          11.21 KB
          • models/
              • __pycache__/
                • arch.cpython-36.pyc
                  13.8 KB
                • layers.cpython-36.pyc
                  20.06 KB
            • arch.py
              23.74 KB
            • layers.py
              31.9 KB
          • pickles/
            • complete_model.h5
              58.23 MB
            • labelencoder.pkl
              58.3 MB
            • text_tokenizer.pkl
              58.88 MB
        • related-work.md
          58.88 MB
        • requirements.txt
          58.88 MB
          • static/
            • stop_grande.jpg
              58.89 MB
          • templates/
            • error.html
              58.89 MB
            • index.html
              58.9 MB
          • utils/
              • __pycache__/
                • helper_functions.cpython-36.pyc
                  58.9 MB
                • load_pickles.cpython-36.pyc
                  58.9 MB
            • helper_functions.py
              58.91 MB
            • load_pickles.py
              58.91 MB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp