HyperAI超神経

VQA ビジュアル質問応答データセット (Visual Question Answering)

このデータセットの情報は次のものから得られます。 カンピナス州立大学 MO434 主題の知識ベース。

導入

これは、画像と画像に関する自然言語の質問に基づいて回答を生成するシンプルな Flask アプリです。このアプリは、内部で TensorFlow でトレーニングされた深層学習モデルを使用します。

モデル概要

ディープラーニングの発展により、マルチモーダルラーニング関連タスクの解決が促進されました。ビジュアル質問応答 (VQA) は非常に困難な例であり、画像からの高レベルのシーン解釈と、関連する質問応答言語と組み合わせたモデリングが必要です。画像とその画像に関する自然言語の質問が与えられた場合、タスクは正確な自然言語の回答を提供することです。これは、このタスクを実行するために設計された Keras に実装されたエンドツーエンド システムです。

モデルのアーキテクチャは論文に基づいています 視覚的な質問応答のための階層型質問と画像の同時注意

VQA.torrent
シーディング 1ダウンロード中 1ダウンロード完了 118総ダウンロード数 294
  • VQA/
    • README.md
      1.56 KB
    • README.txt
      3.12 KB
      • data/
        • LICENSE
          4.16 KB
        • README.md
          8.21 KB
        • main.py
          11.21 KB
          • models/
              • __pycache__/
                • arch.cpython-36.pyc
                  13.8 KB
                • layers.cpython-36.pyc
                  20.06 KB
            • arch.py
              23.74 KB
            • layers.py
              31.9 KB
          • pickles/
            • complete_model.h5
              58.23 MB
            • labelencoder.pkl
              58.3 MB
            • text_tokenizer.pkl
              58.88 MB
        • related-work.md
          58.88 MB
        • requirements.txt
          58.88 MB
          • static/
            • stop_grande.jpg
              58.89 MB
          • templates/
            • error.html
              58.89 MB
            • index.html
              58.9 MB
          • utils/
              • __pycache__/
                • helper_functions.cpython-36.pyc
                  58.9 MB
                • load_pickles.cpython-36.pyc
                  58.9 MB
            • helper_functions.py
              58.91 MB
            • load_pickles.py
              58.91 MB