HyperAI超神経

VizWiz 視覚障害者向けの視覚的な質問応答データ セット

日付

3年前

サイズ

17.65 GB

組織

テキサス大学オースティン校

公開URL

vizwiz.org

ライセンス

CC BY 4.0

カテゴリ

特色图像

VizWiz-VQA (Visual Question Answering) は、ブラインドビジュアル質問応答用の画像データセットです。視覚障害のあるユーザーは、VizWiz ソフトウェアを使用して写真を撮り、その写真に関する口頭での質問と、その質問に対するクラウドソーシングによる 10 件の回答を記録します。このデータ セットは、次の 2 つの問題を解決するために使用されます。1 つは視覚的な質問に対する答えを予測することであり、もう 1 つは視覚的な質問に答えられるかどうかを判断することです。このデータセットは、視覚障害者が生活上の障害を解決できるよう、より一般的なアルゴリズムを研究することを目的としています。

このデータセットには(2020年最新版)が含まれています:

  • 20,523 組のトレーニング画像/質問
  • 205,230 件のトレーニング回答/回答の信頼度
  • 4319組の検証画像/質問
  • 43,190 件の検証回答/回答の信頼性
  • 8,000 のテスト画像と質問のペア
VisWiz.torrent
シーディング 2ダウンロード中 1ダウンロード完了 106総ダウンロード数 202
  • VisWiz/
    • README.md
      1.41 KB
    • README.txt
      2.82 KB
      • data/
        • API.zip
          176.98 MB
        • Annotations.zip
          178.55 MB
        • test.zip
          3.88 GB
        • train.zip
          14.4 GB
        • val.zip
          17.65 GB