HyperAI초신경

HowToVQA69M 비디오 질의응답 데이터 세트

날짜

3년 전

크기

7.88 GB

기관

발행 주소

antoyang.github.io

라이선스

其他

特色图像

VQA는 시각적 질의응답을 의미합니다. HowToVQA69M은 69,270,581개의 질문과 답변을 포함하는 비디오 질문 답변 데이터 세트입니다. 기존 비디오 질의응답 데이터세트인 VideoQA의 두 배 규모입니다.

평균적으로 각 원시 영상은 12.1초 길이의 43개 영상 클립을 생성하며, 1.2개의 질문과 답변이 연결되어 있고, 질문에는 8.7개의 단어가, 답변에는 2.4개의 단어가 포함되어 있습니다. HowToVQA69M 데이터 세트는 매우 다양하며, 1,600만 개 이상의 고유 답변이 포함되어 있습니다. 이 중 200만 개 이상의 고유 답변이 두 번 이상 나타나고 30만 개 이상의 고유 답변이 10번 이상 나타납니다.

HowToVQA69M.torrent
시딩 1다운로드 중 1완료됨 476총 다운로드 횟수 407
  • HowToVQA69M/
    • README.md
      1.23 KB
    • README.txt
      2.47 KB
      • data/
        • ReadMe.txt
          3.38 KB
        • howtovqa.pkl
          5.98 GB
        • train_howtovqa.csv
          6.02 GB
        • val_howtovqa.csv
          6.02 GB
          • vedio/
            • HowTo100M.zip
              7.88 GB