VizWiz 盲人视觉问答数据集

日期

2 年前

大小

17.65 GB

机构

University of Texas at Austin

发布地址

vizwiz.org

许可协议

CC BY 4.0

特色图像

VizWiz-VQA (Visual Question Answering) 是一个盲人视觉问答的图像数据集。盲人用户使用 VizWiz 软件拍摄一张照片,并记录一个关于该照片的口头问题和该问题的 10 个众包答案。该数据集用于解决以下两个问题,一是预测一个视觉问题的答案,二是判断一个视觉问题能否被回答。该数据集旨在研究更多通用算法,帮助盲人解决生活障碍。

该数据集包括(2020 最新版)

  • 20,523 对训练图像/问题
  • 205,230 对训练答案/答案置信度
  • 4319 对验证图像/问题
  • 43,190 对验证答案/答案置信度
  • 8,000 对测试图片/问题
VisWiz.torrent

做种 1

下载中 0

已完成 18

总下载 34

  • VisWiz/
    • README.md
      1.41 KB
    • README.txt
      2.82 KB
      • data/
        • API.zip
          176.98 MB
        • Annotations.zip
          178.55 MB
        • test.zip
          3.88 GB
        • train.zip
          14.4 GB
        • val.zip
          17.65 GB