HyperAI

VQA-Datensatz Für Visuelle Fragen Und Antworten

Datum

vor einem Jahr

Größe

58.91 MB

Organisation

Lizenz

其他

Dieser Datensatz stammt aus Staatliche Universität Campinas MO434 Fachliche Wissensdatenbank.

Einführung

Dies ist eine einfache Flask-Anwendung, die Antworten basierend auf einem Bild und Fragen in natürlicher Sprache zum Bild generiert. Die App verwendet im Hintergrund ein mit TensorFlow trainiertes Deep-Learning-Modell.

Modellübersicht

Die Entwicklung des Deep Learning hat die Lösung multimodaler Lernaufgaben gefördert. Visual Question Answering (VQA) ist ein sehr anspruchsvolles Beispiel, das eine Szeneninterpretation auf hohem Niveau aus Bildern und die Modellierung einer relevanten Frage-Antwort-Sprache erfordert. Bei einem Bild und einer Frage in natürlicher Sprache zu dem Bild besteht die Aufgabe darin, eine genaue Antwort in natürlicher Sprache zu geben. Dies ist ein mit Keras implementiertes End-to-End-System, das diese Aufgabe erfüllen soll.

Modellarchitektur basierend auf dem Papier Hierarchische Frage-Bild-Co-Attention zur visuellen Beantwortung von Fragen .

VQA.torrent
Seeding 1Herunterladen 1Abgeschlossen 118Gesamtdownloads 294
  • VQA/
    • README.md
      1.56 KB
    • README.txt
      3.12 KB
      • data/
        • LICENSE
          4.16 KB
        • README.md
          8.21 KB
        • main.py
          11.21 KB
          • models/
              • __pycache__/
                • arch.cpython-36.pyc
                  13.8 KB
                • layers.cpython-36.pyc
                  20.06 KB
            • arch.py
              23.74 KB
            • layers.py
              31.9 KB
          • pickles/
            • complete_model.h5
              58.23 MB
            • labelencoder.pkl
              58.3 MB
            • text_tokenizer.pkl
              58.88 MB
        • related-work.md
          58.88 MB
        • requirements.txt
          58.88 MB
          • static/
            • stop_grande.jpg
              58.89 MB
          • templates/
            • error.html
              58.89 MB
            • index.html
              58.9 MB
          • utils/
              • __pycache__/
                • helper_functions.cpython-36.pyc
                  58.9 MB
                • load_pickles.cpython-36.pyc
                  58.9 MB
            • helper_functions.py
              58.91 MB
            • load_pickles.py
              58.91 MB