HyperAI

Ensemble De Données De Questions-réponses Vidéo HowToVQA69M

Date

il y a 3 ans

Taille

7.88 GB

Organisation

URL de publication

antoyang.github.io

Licence

其他

特色图像

VQA signifie « Visual Question Answering ». HowToVQA69M est un ensemble de données de questions-réponses vidéo contenant 69 270 581 questions et réponses. Son échelle est deux fois supérieure à celle de l'ensemble de données de questions-réponses vidéo existant VideoQA.

En moyenne, chaque vidéo brute produit 43 clips vidéo, chacun d'une durée de 12,1 secondes et associé à 1,2 questions et réponses, les questions contenant 8,7 mots et les réponses contenant 2,4 mots. L'ensemble de données HowToVQA69M est très diversifié, contenant plus de 16 millions de réponses uniques, dont plus de 2 millions de réponses uniques apparaissent plus d'une fois et plus de 300 000 réponses uniques apparaissent plus de 10 fois.

HowToVQA69M.torrent
Partage 1Téléchargement 1Terminés 476Téléchargements totaux 407
  • HowToVQA69M/
    • README.md
      1.23 KB
    • README.txt
      2.47 KB
      • data/
        • ReadMe.txt
          3.38 KB
        • howtovqa.pkl
          5.98 GB
        • train_howtovqa.csv
          6.02 GB
        • val_howtovqa.csv
          6.02 GB
          • vedio/
            • HowTo100M.zip
              7.88 GB