VizWiz 視覚障害者向けの視覚的な質問応答データ セット

VizWiz-VQA (Visual Question Answering) は、ブラインドビジュアル質問応答用の画像データセットです。視覚障害のあるユーザーは、VizWiz ソフトウェアを使用して写真を撮り、その写真に関する口頭での質問と、その質問に対するクラウドソーシングによる 10 件の回答を記録します。このデータ セットは、次の 2 つの問題を解決するために使用されます。1 つは視覚的な質問に対する答えを予測することであり、もう 1 つは視覚的な質問に答えられるかどうかを判断することです。このデータセットは、視覚障害者が生活上の障害を解決できるよう、より一般的なアルゴリズムを研究することを目的としています。
このデータセットには(2020年最新版)が含まれています:
- 20,523 組のトレーニング画像/質問
- 205,230 件のトレーニング回答/回答の信頼度
- 4319組の検証画像/質問
- 43,190 件の検証回答/回答の信頼性
- 8,000 のテスト画像と質問のペア
VisWiz.torrent
シーディング 2ダウンロード中 1ダウンロード完了 106総ダウンロード数 202