Date

il y a 3 ans

Taille

52.82 MB

Organisation

URL de publication

research.google.com

URL du document

arxiv.org

Licence

CC BY 4.0

Balises

Reconnaissance D'action

AVA, abréviation de Atomic Visual Actions, est un ensemble de données vidéo avec des annotations audiovisuelles conçues pour former les robots à comprendre les activités humaines. Chaque clip vidéo est annoté en détail par des annotateurs, reflétant les diverses scènes, conditions d'enregistrement et expressions des activités humaines.

Les annotations de l'ensemble de données incluent :

Cinétique (AVA-Kinetics) : C'est un croisement entre AVA et Kinetics. Afin de fournir des étiquettes d'action localisées sur une plus large gamme de scènes visuelles, les auteurs fournissent des étiquettes d'action AVA sur les vidéos Kinetics-700, doublant presque le nombre total d'annotations et augmentant le nombre de vidéos de certaines catégories spécifiques de plus de 500 fois.
Actions (AvA-Actions) : L'ensemble de données AVA annote de manière dense 80 actions visuelles atomiques dans 430 clips vidéo de 15 minutes. Ces actions sont localisées dans l’espace et le temps, générant 1,62 million d’étiquettes d’actions, dont un grand nombre sont fréquemment utilisées.
Activité parlée (AVA ActiveSpeaker, AVA Speech) : AVA ActiveSpeaker associe les sons et les visages visibles dans les vidéos AVA v1.0, ce qui donne 3,65 millions d'images étiquetées avec environ 39 000 visages. AVA Speech annote de manière dense l'activité vocale dans les vidéos AVA v1.0 et annote explicitement 3 conditions de bruit de fond, ce qui donne environ 4 600 clips annotés couvrant 45 heures.

AVA.torrent

Seeding 1Téléchargement 0Terminé 711Total Downloads 769

AVA/
- README.md
  1.9 KB
- README.txt
  3.79 KB

Ce jeu de données est fourni par les utilisateurs de la communauté et est destiné uniquement à des fins éducatives et informatives. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour examen et retrait rapides.

Associé Jeux de données

Ensemble De Données d'appels De Fonctions Mobiles

il y a un mois

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

il y a un mois

Ensemble De Données d'évaluation Des Capacités De Planification À Long Terme De DeepPlanning

il y a 6 jours

Ensemble De Données Vocales WenetSpeech-Chuan Sichuan-Chongqing

il y a 2 mois

MUVR (Multimodal Uncropped Video Retrieval Benchmark)

il y a 2 mois

Ensemble De Données De Référence Pour La Compréhension d'images Infrarouges IF-Bench

il y a 2 mois

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

il y a un mois

Ensemble De Données De Référence HumanSense

il y a 3 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Télécharger

Discuter sur Discord

Date

il y a 3 ans

Taille

52.82 MB

Organisation

URL de publication

research.google.com

URL du document

arxiv.org

Licence

CC BY 4.0

Balises

Reconnaissance D'action

Les annotations de l'ensemble de données incluent :

Cinétique (AVA-Kinetics) : C'est un croisement entre AVA et Kinetics. Afin de fournir des étiquettes d'action localisées sur une plus large gamme de scènes visuelles, les auteurs fournissent des étiquettes d'action AVA sur les vidéos Kinetics-700, doublant presque le nombre total d'annotations et augmentant le nombre de vidéos de certaines catégories spécifiques de plus de 500 fois.
Actions (AvA-Actions) : L'ensemble de données AVA annote de manière dense 80 actions visuelles atomiques dans 430 clips vidéo de 15 minutes. Ces actions sont localisées dans l’espace et le temps, générant 1,62 million d’étiquettes d’actions, dont un grand nombre sont fréquemment utilisées.
Activité parlée (AVA ActiveSpeaker, AVA Speech) : AVA ActiveSpeaker associe les sons et les visages visibles dans les vidéos AVA v1.0, ce qui donne 3,65 millions d'images étiquetées avec environ 39 000 visages. AVA Speech annote de manière dense l'activité vocale dans les vidéos AVA v1.0 et annote explicitement 3 conditions de bruit de fond, ce qui donne environ 4 600 clips annotés couvrant 45 heures.

AVA.torrent

Seeding 1Téléchargement 0Terminé 711Total Downloads 769

AVA/
- README.md
  1.9 KB
- README.txt
  3.79 KB

Associé Jeux de données

Ensemble De Données d'appels De Fonctions Mobiles

il y a un mois

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

il y a un mois

Ensemble De Données d'évaluation Des Capacités De Planification À Long Terme De DeepPlanning

il y a 6 jours

Ensemble De Données Vocales WenetSpeech-Chuan Sichuan-Chongqing

il y a 2 mois

MUVR (Multimodal Uncropped Video Retrieval Benchmark)

il y a 2 mois

Ensemble De Données De Référence Pour La Compréhension d'images Infrarouges IF-Bench

il y a 2 mois

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

il y a un mois

Ensemble De Données De Référence HumanSense

il y a 3 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Ensemble De Données De Reconnaissance d'actions AVA

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données De Reconnaissance d'actions AVA

Associé Jeux de données

Ensemble De Données d'appels De Fonctions Mobiles

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

Ensemble De Données d'évaluation Des Capacités De Planification À Long Terme De DeepPlanning

Ensemble De Données Vocales WenetSpeech-Chuan Sichuan-Chongqing

MUVR (Multimodal Uncropped Video Retrieval Benchmark)

Ensemble De Données De Référence Pour La Compréhension d'images Infrarouges IF-Bench

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données De Référence HumanSense

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données De Reconnaissance d'actions AVA

Associé Jeux de données

Ensemble De Données d'appels De Fonctions Mobiles

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

Ensemble De Données d'évaluation Des Capacités De Planification À Long Terme De DeepPlanning

Ensemble De Données Vocales WenetSpeech-Chuan Sichuan-Chongqing

MUVR (Multimodal Uncropped Video Retrieval Benchmark)

Ensemble De Données De Référence Pour La Compréhension d'images Infrarouges IF-Bench

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données De Référence HumanSense

Créer de l'IA avec l'IA

HyperAI Newsletters

Associé Jeux de données

Ensemble De Données d'appels De Fonctions Mobiles

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

Ensemble De Données d'évaluation Des Capacités De Planification À Long Terme De DeepPlanning

Ensemble De Données Vocales WenetSpeech-Chuan Sichuan-Chongqing

MUVR (Multimodal Uncropped Video Retrieval Benchmark)

Ensemble De Données De Référence Pour La Compréhension d'images Infrarouges IF-Bench

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données De Référence HumanSense

Associé Jeux de données

Ensemble De Données d'appels De Fonctions Mobiles

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

Ensemble De Données d'évaluation Des Capacités De Planification À Long Terme De DeepPlanning

Ensemble De Données Vocales WenetSpeech-Chuan Sichuan-Chongqing

MUVR (Multimodal Uncropped Video Retrieval Benchmark)

Ensemble De Données De Référence Pour La Compréhension d'images Infrarouges IF-Bench

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données De Référence HumanSense