HyperAI

Ensemble De Données De Reconnaissance D'actions AVA

Date

il y a 3 ans

Taille

52.82 MB

Organisation

Université de Californie à Berkeley

URL de publication

research.google.com

Licence

CC BY 4.0

特色图像

AVA, abréviation de Atomic Visual Actions, est un ensemble de données vidéo avec des annotations audiovisuelles conçues pour former les robots à comprendre les activités humaines. Chaque clip vidéo est annoté en détail par des annotateurs, reflétant les diverses scènes, conditions d'enregistrement et expressions des activités humaines.

Les annotations de l'ensemble de données incluent :

  • Cinétique (AVA-Kinetics) : C'est un croisement entre AVA et Kinetics. Afin de fournir des étiquettes d'action localisées sur une plus large gamme de scènes visuelles, les auteurs fournissent des étiquettes d'action AVA sur les vidéos Kinetics-700, doublant presque le nombre total d'annotations et augmentant le nombre de vidéos de certaines catégories spécifiques de plus de 500 fois.
  • Actions (AvA-Actions) : L'ensemble de données AVA annote de manière dense 80 actions visuelles atomiques dans 430 clips vidéo de 15 minutes. Ces actions sont localisées dans l’espace et le temps, générant 1,62 million d’étiquettes d’actions, dont un grand nombre sont fréquemment utilisées.
  • Activité parlée (AVA ActiveSpeaker, AVA Speech) : AVA ActiveSpeaker associe les sons et les visages visibles dans les vidéos AVA v1.0, ce qui donne 3,65 millions d'images étiquetées avec environ 39 000 visages. AVA Speech annote de manière dense l'activité vocale dans les vidéos AVA v1.0 et annote explicitement 3 conditions de bruit de fond, ce qui donne environ 4 600 clips annotés couvrant 45 heures.
AVA.torrent
Partage 1Téléchargement 1Terminés 496Téléchargements totaux 525
  • AVA/
    • README.md
      1.9 KB
    • README.txt
      3.79 KB
      • data/
          • AVA Actions (v2.2)/
            • ava_included_timestamps_v2.2.txt
              8.17 KB
            • ava_test_excluded_timestamps_v2.2.csv
              9.27 KB
            • ava_train_excluded_timestamps_v2.2.csv
              11.94 KB
            • ava_train_v2.2.csv.zip
              5.44 MB
            • ava_v2.2.zip
              12.81 MB
            • ava_val_excluded_timestamps_v2.2.csv
              12.81 MB
            • ava_val_v2.2.csv.zip
              14.34 MB
          • AVA Active Speaker (v1.0)/
            • ava_activespeaker_train_v1.0.tar.bz2
              31.69 MB
            • ava_activespeaker_val_v1.0.tar.bz2
              36.55 MB
          • AVA Speech (v1.0)/
            • ava_speech_labels_v1.csv
              38.11 MB
          • AVA-Kinetics (v1.0)/
            • ava_kinetics_v1_0.tar.gz
              52.82 MB