HyperAIHyperAI

Command Palette

Search for a command to run...

시각 장애인을 위한 VizWiz 시각적 질문 답변 데이터 세트

날짜

4년 전

크기

17.65 GB

조직

University of Texas at Austin

게시 URL

vizwiz.org

Paper URL

arxiv.org

라이선스

CC BY 4.0

Featured Image

VizWiz-VQA(Visual Question Answering)는 시각 장애인을 위한 시각적 질의응답을 위한 이미지 데이터 세트입니다. 시각 장애인 사용자는 VizWiz 소프트웨어를 사용하여 사진을 찍고 사진에 대한 구두 질문과 해당 질문에 대한 군중 소싱 답변 10개를 녹음합니다. 이 데이터 세트는 다음 두 가지 문제를 해결하는 데 사용됩니다. 하나는 시각적 질문에 대한 답을 예측하는 것이고, 다른 하나는 시각적 질문에 답할 수 있는지 여부를 판단하는 것입니다. 이 데이터 세트는 시각 장애인이 삶의 장애물을 해결하는 데 도움이 되는 보다 일반적인 알고리즘을 연구하는 것을 목표로 합니다. 데이터 세트에는 (2020년 최신 버전)이 포함됩니다.:

  • 20,523쌍의 훈련 이미지/질문
  • 답변 훈련/답변 신뢰도 205,230
  • 4319 검증 이미지/질문
  • 43,190쌍의 검증된 답변/답변 신뢰도
  • 8,000쌍의 테스트 이미지/질문
VisWiz.torrent
시딩 1다운로드 중 0완료됨 265총 다운로드 수 428
  • VisWiz/
    • README.md
      1.41 KB
    • README.txt
      2.82 KB
      • data/
        • API.zip
          176.98 MB
        • val.zip
          17.65 GB
        • test.zip
          3.88 GB
        • train.zip
          14.4 GB
        • Annotations.zip
          178.55 MB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp