Command Palette

Search for a command to run...

Visual7W 시각적 질문 답변 데이터 세트

날짜

3년 전

크기

1.76 GB

기관

스탠포드 대학

발행 주소

ai.stanford.edu

논문 URL

arxiv.org

라이선스

기타

Featured Image

Visual7W는 이미지 콘텐츠를 이해하기 위한 데이터 세트입니다. 텍스트의 이미지 영역과 그 연관성을 설명하여 시각적인 질문에 답하는 작업을 수행합니다. 데이터 세트에는 이미지 자체뿐만 아니라 이미지 영역의 내용과 관련된 질문과 답변도 포함되어 있습니다.

Visual7W는 Visual Genome 데이터 세트의 하위 집합으로, 47,300개의 COCO 데이터 세트 이미지, 327,929개의 질문-답변 쌍, 1,311,756개의 인간이 생성한 객관식 질문, 36,579개 범주를 포괄하는 561,459개의 객체 접지를 포함합니다.

Visual7W의 질문은 주로 무엇, 어디, 어떻게, 언제, 누구, 왜, 어떤 것으로 구성되어 있습니다. 질문은 객관식이며, 각 질문에는 4가지의 답이 가능합니다.

Visual7W.torrent
시딩 2다운로드 중 0완료됨 550총 다운로드 횟수 673
  • Visual7W/
    • README.md
      1.34 KB
    • README.txt
      2.68 KB
      • data/
        • dataset_v7w_grounding_annotations.zip
          7.07 MB
        • dataset_v7w_pointing.zip
          18.56 MB
        • dataset_v7w_telling.zip
          24.2 MB
        • visual7w-toolkit
          24.39 MB
        • visual7w_images.zip
          1.76 GB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp