VQA (v2.0) オープンな質問と回答のデータ セット
Visual Question Answering (v2.0) の正式名である VQA (v2.0) は、画像に関する手動で注釈が付けられたオープンな質問と回答のデータ セットです。これらの質問に答えるには、画像、言語、常識をある程度理解する必要があります。
画像例:

データセットには以下が含まれます。
- 265,016 枚の画像 (COCO および抽象シーン データセットより)
- 各画像に含まれる質問の数は 3 以上 (平均 5.4 質問)
- 各質問には 10 個の真実が含まれています
- 各質問には 3 つの妥当な (ただし必ずしも正しいとは限らない) 回答が含まれています
- 自動評価指標
VQA データセットは 2015 年 10 月に初めてリリースされ、VQA v2.0 は 2017 年 4 月にリリースされました。このデータセットはバージョン v2.0 です。VQA v1.0 と比較して、v2.0 では言語の偏りを最小限に抑えるために各質問に画像が追加されています。
Visual_Question_Answering_(VQA).torrent
シーディング 1ダウンロード中 1ダウンロード完了 570総ダウンロード数 1,327