Datum

vor 4 Jahren

Größe

52.82 MB

Organisation

Veröffentlichungs-URL

research.google.com

Paper-URL

arxiv.org

Lizenz

CC BY 4.0

Tags

Aktionserkennung

AVA, dessen vollständiger Name Atomic Visual Actions lautet, ist ein Videodatensatz mit audiovisuellen Anmerkungen, der dazu dient, Robotern das Verstehen menschlicher Aktivitäten beizubringen. Jeder Videoclip wird von Kommentatoren detailliert kommentiert, wobei die unterschiedlichen Szenen, Aufnahmebedingungen und Ausdrucksformen menschlicher Aktivitäten berücksichtigt werden. Die Datensatzanmerkungen umfassen:

Kinetics (AVA-Kinetics): Es ist eine Kreuzung zwischen AVA und Kinetics. Um lokalisierte Aktionsbeschriftungen für eine größere Bandbreite visueller Szenen bereitzustellen, versehen die Autoren Kinetics-700-Videos mit AVA-Aktionsbeschriftungen, wodurch sich die Gesamtzahl der Anmerkungen fast verdoppelt und die Anzahl der Videos bestimmter Kategorien um mehr als das 500-fache erhöht.
Aktionen (AvA-Actions): Der AVA-Datensatz enthält 80 atomare visuelle Aktionen in 430 15-minütigen Filmclips. Diese Aktionen sind räumlich und zeitlich verortet und generieren 1,62 Millionen Aktionsbezeichnungen, von denen eine große Anzahl häufig verwendet wird.
Gesprochene Aktivität (AVA ActiveSpeaker, AVA Speech): AVA ActiveSpeaker verknüpft Geräusche und sichtbare Gesichter in AVA v1.0-Videos, was zu 3,65 Millionen Frames führt, die mit ungefähr 39.000 Gesichtern beschriftet sind. AVA Speech kommentiert die Sprachaktivität in AVA v1.0-Videos umfassend und kommentiert explizit drei Hintergrundgeräuschbedingungen, was zu ungefähr 4.600 kommentierten Clips mit einer Laufzeit von 45 Stunden führt.

AVA.torrent

Seeding 2Wird heruntergeladen 0Abgeschlossen 730Gesamtdownloads 798

AVA/
- README.md
  1.9 KB
- README.txt
  3.79 KB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Download

Auf Discord diskutieren

Datum

vor 4 Jahren

Größe

52.82 MB

Organisation

Veröffentlichungs-URL

research.google.com

Paper-URL

arxiv.org

Lizenz

CC BY 4.0

Tags

Aktionserkennung

Kinetics (AVA-Kinetics): Es ist eine Kreuzung zwischen AVA und Kinetics. Um lokalisierte Aktionsbeschriftungen für eine größere Bandbreite visueller Szenen bereitzustellen, versehen die Autoren Kinetics-700-Videos mit AVA-Aktionsbeschriftungen, wodurch sich die Gesamtzahl der Anmerkungen fast verdoppelt und die Anzahl der Videos bestimmter Kategorien um mehr als das 500-fache erhöht.
Aktionen (AvA-Actions): Der AVA-Datensatz enthält 80 atomare visuelle Aktionen in 430 15-minütigen Filmclips. Diese Aktionen sind räumlich und zeitlich verortet und generieren 1,62 Millionen Aktionsbezeichnungen, von denen eine große Anzahl häufig verwendet wird.
Gesprochene Aktivität (AVA ActiveSpeaker, AVA Speech): AVA ActiveSpeaker verknüpft Geräusche und sichtbare Gesichter in AVA v1.0-Videos, was zu 3,65 Millionen Frames führt, die mit ungefähr 39.000 Gesichtern beschriftet sind. AVA Speech kommentiert die Sprachaktivität in AVA v1.0-Videos umfassend und kommentiert explizit drei Hintergrundgeräuschbedingungen, was zu ungefähr 4.600 kommentierten Clips mit einer Laufzeit von 45 Stunden führt.

AVA.torrent

Seeding 2Wird heruntergeladen 0Abgeschlossen 730Gesamtdownloads 798

AVA/
- README.md
  1.9 KB
- README.txt
  3.79 KB

Zugehörige Datensätze

Pan-Cancer scRNA-Seq Cancer Single-Cell Transcriptional Atlas Dataset

vor 3 Monaten

DeepPlanning-Datensatz Zur Bewertung Der Langfristigen Planungsfähigkeit

vor 5 Monaten

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

vor 8 Tagen

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

vor 8 Tagen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

AVA-Aktionserkennungsdatensatz

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

AVA-Aktionserkennungsdatensatz

Zugehörige Datensätze

Pan-Cancer scRNA-Seq Cancer Single-Cell Transcriptional Atlas Dataset

DeepPlanning-Datensatz Zur Bewertung Der Langfristigen Planungsfähigkeit

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

AVA-Aktionserkennungsdatensatz

Zugehörige Datensätze

Pan-Cancer scRNA-Seq Cancer Single-Cell Transcriptional Atlas Dataset

DeepPlanning-Datensatz Zur Bewertung Der Langfristigen Planungsfähigkeit

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

Pan-Cancer scRNA-Seq Cancer Single-Cell Transcriptional Atlas Dataset

DeepPlanning-Datensatz Zur Bewertung Der Langfristigen Planungsfähigkeit

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

Zugehörige Datensätze

Pan-Cancer scRNA-Seq Cancer Single-Cell Transcriptional Atlas Dataset

DeepPlanning-Datensatz Zur Bewertung Der Langfristigen Planungsfähigkeit

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen