Command Palette

Search for a command to run...

HowToVQA69M 비디오 질의응답 데이터 세트

날짜

3년 전

크기

7.88 GB

기관

발행 주소

antoyang.github.io

논문 URL

arxiv.org

라이선스

기타

Featured Image

VQA는 시각적 질의응답을 의미합니다. HowToVQA69M은 69,270,581개의 질문과 답변을 포함하는 비디오 질문 답변 데이터 세트입니다. 기존 비디오 질의응답 데이터세트인 VideoQA의 두 배 규모입니다.

평균적으로 각 원시 영상은 12.1초 길이의 43개 영상 클립을 생성하며, 1.2개의 질문과 답변이 연결되어 있고, 질문에는 8.7개의 단어가, 답변에는 2.4개의 단어가 포함되어 있습니다. HowToVQA69M 데이터 세트는 매우 다양하며, 1,600만 개 이상의 고유 답변이 포함되어 있습니다. 이 중 200만 개 이상의 고유 답변이 두 번 이상 나타나고 30만 개 이상의 고유 답변이 10번 이상 나타납니다.

HowToVQA69M.torrent
시딩 2다운로드 중 0완료됨 653총 다운로드 횟수 555
  • HowToVQA69M/
    • README.md
      1.23 KB
    • README.txt
      2.47 KB
      • data/
        • ReadMe.txt
          3.38 KB
        • howtovqa.pkl
          5.98 GB
        • train_howtovqa.csv
          6.02 GB
        • val_howtovqa.csv
          6.02 GB
          • vedio/
            • HowTo100M.zip
              7.88 GB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
HowToVQA69M 비디오 질의응답 데이터 세트 | 데이터셋 | HyperAI초신경