HyperAI超神経

TDIUC ビジュアル質問応答データ セット

特色图像

TDIUC は、Task Directed Image Understanding Challenge の略で、視覚的な質問と回答のデータ セットです。データ セットには、MS COCO および視覚ゲノム データ セットからの 160 万の質問と 170,000 の画像が含まれており、画像と質問のペアは 12 のカテゴリと 4 つの追加の評価行列に分割され、モデルの堅牢性と推論能力を評価します。

TDIUC 統計:

  • 12 種類の質問 (いくつかの「不条理な」質問を含む、基本的なタスクごとにグループ化)
  • 167,437 枚の画像 (MS-COCO および Visual Genome より)
  • 165 万の質問と回答のペア (3 つのソース)
  • 4 つの新しい評価指標 (バイアスを補正するように設計)
  • 6 つの新しい実験セットアップ (VQA アルゴリズムに関連する重要な質問に答える)
TDIUC.torrent
シーディング 2ダウンロード中 2ダウンロード完了 510総ダウンロード数 499
  • TDIUC/
    • README.md
      1.39 KB
    • README.txt
      2.78 KB
      • data/
          • Abstract_Scenes/
              • VQA_Annotations/
                • Annotations_Train_abstract_v002.zip
                  2.53 MB
                • Annotations_Val_abstract_v002.zip
                  3.79 MB
              • VQA_Input-Images/
                • scene_img_abstract_v002_test2015.zip
                  2.69 GB
                • scene_img_abstract_v002_train2015.zip
                  5.4 GB
                • scene_img_abstract_v002_val2015.zip
                  6.75 GB
              • VQA_Input-Questions/
                • Questions_Test_abstract_v002.zip
                  6.76 GB
                • Questions_Train_abstract_v002.zip
                  6.76 GB
                • Questions_Val_abstract_v002.zip
                  6.76 GB
          • Real_Images/
              • VQA_Annotations/
                • Annotations_Train_mscoco.zip
                  6.78 GB
                • Annotations_Val_mscoco.zip
                  6.78 GB
              • VQA_Input-Images/
                • test2015.zip
                  19.14 GB
                • train2014.zip
                  31.72 GB
                • val2014.zip
                  37.91 GB
              • VQA_Input-Questions/
                • Questions_Test_mscoco.zip
                  37.94 GB
                • Questions_Train_mscoco.zip
                  37.96 GB
                • Questions_Val_mscoco.zip
                  37.97 GB