HyperAIHyperAI

Command Palette

Search for a command to run...

AVA-Aktionserkennungsdatensatz

Date

vor 3 Jahren

Size

52.82 MB

Organization

Universität von Kalifornien, Berkeley

Paper URL

arxiv.org

License

CC BY 4.0

Featured Image

AVA, dessen vollständiger Name Atomic Visual Actions lautet, ist ein Videodatensatz mit audiovisuellen Anmerkungen, der dazu dient, Robotern das Verstehen menschlicher Aktivitäten beizubringen. Jeder Videoclip wird von Kommentatoren detailliert kommentiert, wobei die unterschiedlichen Szenen, Aufnahmebedingungen und Ausdrucksformen menschlicher Aktivitäten berücksichtigt werden.

Die Datensatzanmerkungen umfassen:

  • Kinetics (AVA-Kinetics): Es ist eine Kreuzung zwischen AVA und Kinetics. Um lokalisierte Aktionsbeschriftungen für eine größere Bandbreite visueller Szenen bereitzustellen, versehen die Autoren Kinetics-700-Videos mit AVA-Aktionsbeschriftungen, wodurch sich die Gesamtzahl der Anmerkungen fast verdoppelt und die Anzahl der Videos bestimmter Kategorien um mehr als das 500-fache erhöht.
  • Aktionen (AvA-Actions): Der AVA-Datensatz enthält 80 atomare visuelle Aktionen in 430 15-minütigen Filmclips. Diese Aktionen sind räumlich und zeitlich verortet und generieren 1,62 Millionen Aktionsbezeichnungen, von denen eine große Anzahl häufig verwendet wird.
  • Gesprochene Aktivität (AVA ActiveSpeaker, AVA Speech): AVA ActiveSpeaker verknüpft Geräusche und sichtbare Gesichter in AVA v1.0-Videos, was zu 3,65 Millionen Frames führt, die mit ungefähr 39.000 Gesichtern beschriftet sind. AVA Speech kommentiert die Sprachaktivität in AVA v1.0-Videos umfassend und kommentiert explizit drei Hintergrundgeräuschbedingungen, was zu ungefähr 4.600 kommentierten Clips mit einer Laufzeit von 45 Stunden führt.
AVA.torrent
Seeding 2Downloading 0Completed 678Total Downloads 745
  • AVA/
    • README.md
      1.9 KB
    • README.txt
      3.79 KB
      • data/
          • AVA Actions (v2.2)/
            • ava_included_timestamps_v2.2.txt
              8.17 KB
            • ava_test_excluded_timestamps_v2.2.csv
              9.27 KB
            • ava_train_excluded_timestamps_v2.2.csv
              11.94 KB
            • ava_train_v2.2.csv.zip
              5.44 MB
            • ava_v2.2.zip
              12.81 MB
            • ava_val_excluded_timestamps_v2.2.csv
              12.81 MB
            • ava_val_v2.2.csv.zip
              14.34 MB
          • AVA Active Speaker (v1.0)/
            • ava_activespeaker_train_v1.0.tar.bz2
              31.69 MB
            • ava_activespeaker_val_v1.0.tar.bz2
              36.55 MB
          • AVA Speech (v1.0)/
            • ava_speech_labels_v1.csv
              38.11 MB
          • AVA-Kinetics (v1.0)/
            • ava_kinetics_v1_0.tar.gz
              52.82 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
AVA-Aktionserkennungsdatensatz | Datasets | HyperAI