TDIUC ビジュアル質問応答データ セット

日付

2年前

サイズ

37.97 GB

組織

論文URL

arxiv.org

特色图像

TDIUC は、Task Directed Image Understanding Challenge の略で、視覚的な質問と回答のデータ セットです。データ セットには、MS COCO および視覚ゲノム データ セットからの 160 万の質問と 170,000 の画像が含まれており、画像と質問のペアは 12 のカテゴリと 4 つの追加の評価行列に分割され、モデルの堅牢性と推論能力を評価します。

TDIUC 統計:

  • 12 種類の質問 (いくつかの「不条理な」質問を含む、基本的なタスクごとにグループ化)
  • 167,437 枚の画像 (MS-COCO および Visual Genome より)
  • 165 万の質問と回答のペア (3 つのソース)
  • 4 つの新しい評価指標 (バイアスを補正するように設計)
  • 6 つの新しい実験セットアップ (VQA アルゴリズムに関連する重要な質問に答える)
TDIUC.torrent
シーディング 2ダウンロード中 0ダウンロード完了 625総ダウンロード数 602
  • TDIUC/
    • README.md
      1.39 KB
    • README.txt
      2.78 KB
      • data/
          • Abstract_Scenes/
              • VQA_Annotations/
                • Annotations_Train_abstract_v002.zip
                  2.53 MB
                • Annotations_Val_abstract_v002.zip
                  3.79 MB
              • VQA_Input-Images/
                • scene_img_abstract_v002_test2015.zip
                  2.69 GB
                • scene_img_abstract_v002_train2015.zip
                  5.4 GB
                • scene_img_abstract_v002_val2015.zip
                  6.75 GB
              • VQA_Input-Questions/
                • Questions_Test_abstract_v002.zip
                  6.76 GB
                • Questions_Train_abstract_v002.zip
                  6.76 GB
                • Questions_Val_abstract_v002.zip
                  6.76 GB
          • Real_Images/
              • VQA_Annotations/
                • Annotations_Train_mscoco.zip
                  6.78 GB
                • Annotations_Val_mscoco.zip
                  6.78 GB
              • VQA_Input-Images/
                • test2015.zip
                  19.14 GB
                • train2014.zip
                  31.72 GB
                • val2014.zip
                  37.91 GB
              • VQA_Input-Questions/
                • Questions_Test_mscoco.zip
                  37.94 GB
                • Questions_Train_mscoco.zip
                  37.96 GB
                • Questions_Val_mscoco.zip
                  37.97 GB
TDIUC ビジュアル質問応答データ セット | データセット | HyperAI超神経