HyperAIHyperAI

Command Palette

Search for a command to run...

VisDial 이미지 대화 데이터 세트

날짜

4년 전

크기

1.86 GB

조직

Paper URL

arxiv.org

라이선스

CC BY 4.0

Featured Image

Visual Dialog의 전체 이름인 VisDial은 MS COCO 데이터 세트의 이미지를 기반으로 한 수동 주석 문제가 포함된 데이터 세트입니다. 이 데이터 세트는 두 피험자가 Amazon Mechanical Turk에서 사진에 대해 대화를 나누는 것을 통해 개발되었습니다. 그 중 한 명은 질문하는 사람 역할을 하고, 다른 한 명은 답변하는 사람 역할을 합니다. 질문자는 이미지의 텍스트 설명(즉, MS COCO 데이터 세트의 이미지 캡션)만 볼 수 있으며, 원본 이미지는 질문자에게 보이지 않습니다. 그들의 과제는 "그 장면을 더 잘 상상하기 위해" 이 이미지 주변에 질문을 던지는 것이었습니다. 응답자는 질문자가 제기한 질문과 이미지, 캡션을 보고 대답합니다. 두 사람은 최대 10라운드까지 질문을 하고 답하며 대화를 이어갈 수 있습니다. VisDial v1.0에는 다음이 포함됩니다.

  • 훈련 세트: 1,23,287개 이미지, 이미지당 10라운드의 대화
  • 검증 세트: 2,064개 이미지, 이미지당 10라운드의 대화
  • 테스트 세트: 8,000개의 이미지, 이미지당 대화 1턴.
VisDial.torrent
시딩 2다운로드 중 0완료됨 620총 다운로드 수 794
  • VisDial/
    • README.md
      1.58 KB
    • README.txt
      3.15 KB
      • data/
        • visdial_1.0_val.zip
          1.86 GB
        • visdial_1.0_test.zip
          1.51 GB
        • visdial_1.0_train.zip
          1.85 GB
        • VisualDialog_val2018.zip
          1.51 GB
        • VisualDialog_test2018.zip
          1.2 GB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp