HyperAI

AVA-Aktionserkennungsdatensatz

Datum

vor 3 Jahren

Größe

52.82 MB

Organisation

Universität von Kalifornien, Berkeley

Veröffentlichungs-URL

research.google.com

Lizenz

CC BY 4.0

特色图像

AVA, dessen vollständiger Name Atomic Visual Actions lautet, ist ein Videodatensatz mit audiovisuellen Anmerkungen, der dazu dient, Robotern das Verstehen menschlicher Aktivitäten beizubringen. Jeder Videoclip wird von Kommentatoren detailliert kommentiert, wobei die unterschiedlichen Szenen, Aufnahmebedingungen und Ausdrucksformen menschlicher Aktivitäten berücksichtigt werden.

Die Datensatzanmerkungen umfassen:

  • Kinetics (AVA-Kinetics): Es ist eine Kreuzung zwischen AVA und Kinetics. Um lokalisierte Aktionsbeschriftungen für eine größere Bandbreite visueller Szenen bereitzustellen, versehen die Autoren Kinetics-700-Videos mit AVA-Aktionsbeschriftungen, wodurch sich die Gesamtzahl der Anmerkungen fast verdoppelt und die Anzahl der Videos bestimmter Kategorien um mehr als das 500-fache erhöht.
  • Aktionen (AvA-Actions): Der AVA-Datensatz enthält 80 atomare visuelle Aktionen in 430 15-minütigen Filmclips. Diese Aktionen sind räumlich und zeitlich verortet und generieren 1,62 Millionen Aktionsbezeichnungen, von denen eine große Anzahl häufig verwendet wird.
  • Gesprochene Aktivität (AVA ActiveSpeaker, AVA Speech): AVA ActiveSpeaker verknüpft Geräusche und sichtbare Gesichter in AVA v1.0-Videos, was zu 3,65 Millionen Frames führt, die mit ungefähr 39.000 Gesichtern beschriftet sind. AVA Speech kommentiert die Sprachaktivität in AVA v1.0-Videos umfassend und kommentiert explizit drei Hintergrundgeräuschbedingungen, was zu ungefähr 4.600 kommentierten Clips mit einer Laufzeit von 45 Stunden führt.
AVA.torrent
Seeding 1Herunterladen 1Abgeschlossen 496Gesamtdownloads 525
  • AVA/
    • README.md
      1.9 KB
    • README.txt
      3.79 KB
      • data/
          • AVA Actions (v2.2)/
            • ava_included_timestamps_v2.2.txt
              8.17 KB
            • ava_test_excluded_timestamps_v2.2.csv
              9.27 KB
            • ava_train_excluded_timestamps_v2.2.csv
              11.94 KB
            • ava_train_v2.2.csv.zip
              5.44 MB
            • ava_v2.2.zip
              12.81 MB
            • ava_val_excluded_timestamps_v2.2.csv
              12.81 MB
            • ava_val_v2.2.csv.zip
              14.34 MB
          • AVA Active Speaker (v1.0)/
            • ava_activespeaker_train_v1.0.tar.bz2
              31.69 MB
            • ava_activespeaker_val_v1.0.tar.bz2
              36.55 MB
          • AVA Speech (v1.0)/
            • ava_speech_labels_v1.csv
              38.11 MB
          • AVA-Kinetics (v1.0)/
            • ava_kinetics_v1_0.tar.gz
              52.82 MB