HyperAIHyperAI

Command Palette

Search for a command to run...

VizWiz 視覚障害者向けの視覚的な質問応答データ セット

Date

3年前

Size

17.65 GB

Organization

テキサス大学オースティン校

Publish URL

vizwiz.org

Paper URL

arxiv.org

License

CC BY 4.0

Featured Image

VizWiz-VQA (Visual Question Answering) は、ブラインドビジュアル質問応答用の画像データセットです。視覚障害のあるユーザーは、VizWiz ソフトウェアを使用して写真を撮り、その写真に関する口頭での質問と、その質問に対するクラウドソーシングによる 10 件の回答を記録します。このデータ セットは、次の 2 つの問題を解決するために使用されます。1 つは視覚的な質問に対する答えを予測することであり、もう 1 つは視覚的な質問に答えられるかどうかを判断することです。このデータセットは、視覚障害者が生活上の障害を解決できるよう、より一般的なアルゴリズムを研究することを目的としています。

このデータセットには(2020年最新版)が含まれています:

  • 20,523 組のトレーニング画像/質問
  • 205,230 件のトレーニング回答/回答の信頼度
  • 4319組の検証画像/質問
  • 43,190 件の検証回答/回答の信頼性
  • 8,000 のテスト画像と質問のペア
VisWiz.torrent
Seeding 1Downloading 0Completed 244Total Downloads 398
  • VisWiz/
    • README.md
      1.41 KB
    • README.txt
      2.82 KB
      • data/
        • API.zip
          176.98 MB
        • Annotations.zip
          178.55 MB
        • test.zip
          3.88 GB
        • train.zip
          14.4 GB
        • val.zip
          17.65 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています