Visual Question Answering (v2.0) の正式名である VQA (v2.0) は、画像に関する手動で注釈が付けられたオープンな質問と回答のデータ セットです。これらの質問に答えるには、画像、言語、常識をある程度理解する必要があります。
画像例:
データセットには以下が含まれます。
VQA データセットは 2015 年 10 月に初めてリリースされ、VQA v2.0 は 2017 年 4 月にリリースされました。このデータセットはバージョン v2.0 です。VQA v1.0 と比較して、v2.0 では言語の偏りを最小限に抑えるために各質問に画像が追加されています。
做种 1
下载中 1
已完成 489
总下载 1,192