HyperAI초신경

Visual7W 시각적 질문 답변 데이터 세트

날짜

3년 전

크기

1.76 GB

기관

스탠포드 대학

발행 주소

ai.stanford.edu

라이선스

其他

카테고리

特色图像

Visual7W는 이미지 콘텐츠를 이해하기 위한 데이터 세트입니다. 텍스트의 이미지 영역과 그 연관성을 설명하여 시각적인 질문에 답하는 작업을 수행합니다. 데이터 세트에는 이미지 자체뿐만 아니라 이미지 영역의 내용과 관련된 질문과 답변도 포함되어 있습니다.

Visual7W는 Visual Genome 데이터 세트의 하위 집합으로, 47,300개의 COCO 데이터 세트 이미지, 327,929개의 질문-답변 쌍, 1,311,756개의 인간이 생성한 객관식 질문, 36,579개 범주를 포괄하는 561,459개의 객체 접지를 포함합니다.

Visual7W의 질문은 주로 무엇, 어디, 어떻게, 언제, 누구, 왜, 어떤 것으로 구성되어 있습니다. 질문은 객관식이며, 각 질문에는 4가지의 답이 가능합니다.

Visual7W.torrent
시딩 1다운로드 중 1완료됨 397총 다운로드 횟수 510
  • Visual7W/
    • README.md
      1.34 KB
    • README.txt
      2.68 KB
      • data/
        • dataset_v7w_grounding_annotations.zip
          7.07 MB
        • dataset_v7w_pointing.zip
          18.56 MB
        • dataset_v7w_telling.zip
          24.2 MB
        • visual7w-toolkit
          24.39 MB
        • visual7w_images.zip
          1.76 GB