Command Palette

Search for a command to run...

VizWiz 盲人视觉问答数据集

日期

3 年前

大小

17.65 GB

机构

University of Texas at Austin

发布地址

vizwiz.org

论文链接

arxiv.org

许可协议

CC BY 4.0

Featured Image

VizWiz-VQA (Visual Question Answering) 是一个盲人视觉问答的图像数据集。盲人用户使用 VizWiz 软件拍摄一张照片,并记录一个关于该照片的口头问题和该问题的 10 个众包答案。该数据集用于解决以下两个问题,一是预测一个视觉问题的答案,二是判断一个视觉问题能否被回答。该数据集旨在研究更多通用算法,帮助盲人解决生活障碍。

该数据集包括(2020 最新版)

  • 20,523 对训练图像/问题
  • 205,230 对训练答案/答案置信度
  • 4319 对验证图像/问题
  • 43,190 对验证答案/答案置信度
  • 8,000 对测试图片/问题
VisWiz.torrent
做种 2正在下载 0已完成 231总下载次数 383
  • VisWiz/
    • README.md
      1.41 KB
    • README.txt
      2.82 KB
      • data/
        • API.zip
          176.98 MB
        • Annotations.zip
          178.55 MB
        • test.zip
          3.88 GB
        • train.zip
          14.4 GB
        • val.zip
          17.65 GB

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供