Date

il y a 4 ans

Taille

7.88 GB

Organisation

URL de publication

antoyang.github.io

URL du document

arxiv.org

Licence

Other

Balises

Compréhension Vidéo

Réponse À Des Questions Visuelles

Compréhension D'images

Représentation Multimodale

VQA signifie « Visual Question Answering ». HowToVQA69M est un ensemble de données de questions-réponses vidéo contenant 69 270 581 questions et réponses. Son échelle est deux fois supérieure à celle de l'ensemble de données de questions-réponses vidéo existant VideoQA. En moyenne, chaque vidéo brute produit 43 clips vidéo, chacun d'une durée de 12,1 secondes et associé à 1,2 questions et réponses, les questions contenant 8,7 mots et les réponses contenant 2,4 mots. L'ensemble de données HowToVQA69M est très diversifié, contenant plus de 16 millions de réponses uniques, dont plus de 2 millions de réponses uniques apparaissent plus d'une fois et plus de 300 000 réponses uniques apparaissent plus de 10 fois.

HowToVQA69M.torrent

Partage 2Téléchargement 0Terminé 686Total des téléchargements 635

HowToVQA69M/
- README.md
  1.23 KB
- README.txt
  2.47 KB

Ce jeu de données est fourni par les utilisateurs de la communauté et est destiné uniquement à des fins éducatives et informatives. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour examen et retrait rapides.

undefined

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

il y a 8 jours

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Utiliser ce jeu de données

Discuter sur Discord

Date

il y a 4 ans

Taille

7.88 GB

Organisation

URL de publication

antoyang.github.io

URL du document

arxiv.org

Licence

Other

Balises

Compréhension Vidéo

Réponse À Des Questions Visuelles

Compréhension D'images

Représentation Multimodale

HowToVQA69M.torrent

Partage 2Téléchargement 0Terminé 686Total des téléchargements 635

HowToVQA69M/
- README.md
  1.23 KB
- README.txt
  2.47 KB

undefined

Ensemble De Données De Référence Culturelles Latino-américaines CHOCLO

il y a 3 mois

Ensemble De Données Du Problème d'inférence Open-RL

il y a 4 mois

Ensemble De Données EEG THINGS-EEG

il y a 5 mois

Ensemble De Données Sur Les Émotions Du Visage Humain

il y a 3 mois

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

il y a 8 jours

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Ensemble De Données De Questions-réponses Vidéo HowToVQA69M

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données De Questions-réponses Vidéo HowToVQA69M

undefined

Ensemble De Données De Référence Culturelles Latino-américaines CHOCLO

Ensemble De Données Du Problème d'inférence Open-RL

Ensemble De Données EEG THINGS-EEG

Ensemble De Données Sur Les Émotions Du Visage Humain

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données De Questions-réponses Vidéo HowToVQA69M

undefined

Ensemble De Données De Référence Culturelles Latino-américaines CHOCLO

Ensemble De Données Du Problème d'inférence Open-RL

Ensemble De Données EEG THINGS-EEG

Ensemble De Données Sur Les Émotions Du Visage Humain

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Créer de l'IA avec l'IA

HyperAI Newsletters

undefined

Ensemble De Données De Référence Culturelles Latino-américaines CHOCLO

Ensemble De Données Du Problème d'inférence Open-RL

Ensemble De Données EEG THINGS-EEG

Ensemble De Données Sur Les Émotions Du Visage Humain

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

undefined

Ensemble De Données De Référence Culturelles Latino-américaines CHOCLO

Ensemble De Données Du Problème d'inférence Open-RL

Ensemble De Données EEG THINGS-EEG

Ensemble De Données Sur Les Émotions Du Visage Humain

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME