HyperAI

Ensemble De Données De Sous-titres Vidéo MSR-VTT

特色图像

MSR-VTT, nom complet de Microsoft Research Video to Text, est un ensemble de données de sous-titrage vidéo à grande échelle pour les domaines ouverts.

L'ensemble de données comprend 10 000 clips vidéo de 20 catégories, chacun contenant 20 phrases en anglais annotées par Amazon Mechanical Turks. Il y a environ 29 000 mots différents dans tous les sous-titres. La segmentation standard utilise 6 513 segments pour la formation, 497 segments pour la validation et 2 990 segments pour les tests.

MSR-VTT.torrent
Partage 2Téléchargement 1Terminés 783Téléchargements totaux 1,816
  • MSR-VTT/
    • README.md
      1.22 KB
    • README.txt
      2.44 KB
      • data/
        • test-video_ustc.zip
          1.97 GB
        • test_videodatainfo.json
          1.98 GB
        • train-video.zip
          8.07 GB
        • train_val_videodatainfo.json
          8.08 GB