Visual7W ビジュアル質問応答データセット

Visual7W は、画像の内容を理解するためのデータ セットで、画像領域とその相関関係のテキスト説明を通じて視覚的な質問応答 (Visual Question Answering) タスクを実行します。このデータ セットには、画像そのものだけでなく、画像に関連する質問と回答も含まれています。画像領域の内容。
Visual7W は Visual Genome データセットのサブセットであり、47,300 個の COCO データセット画像、327,929 個の質問と回答のペア、人間が作成した 1,311,756 個の多肢選択式質問、および 36,579 カテゴリーをカバーする 561,459 個のオブジェクト根拠が含まれています。
Visual7W の質問は主に、What、Where、How、When、Who、Why、および Which で構成されます。質問は多肢選択式で、各質問には 4 つの回答候補があります。
Visual7W.torrent
シーディング 1ダウンロード中 1ダウンロード完了 397総ダウンロード数 510