HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données De Référence Pour La Description Vidéo DREAM-1K

Date

il y a 4 mois

Organisation

URL de l'article

arxiv.org

Rejoignez la communauté Discord

DREAM-1K est un ensemble de données de référence pour la description vidéo publié par ByteDance. Les résultats de l'étude sont les suivants :Tarsier : Recettes pour la formation et l'évaluation de grands modèles de description vidéo".

L'ensemble de données contient 1 000 clips vidéo annotés (d'environ 10 secondes) de complexité variable, répartis en cinq catégories distinctes, chacun contenant au moins un événement dynamique impossible à identifier précisément à partir d'une seule image. Chaque vidéo est accompagnée d'annotations manuelles détaillées couvrant tous les événements, actions et mouvements.

Catégorie de source de données :

  • Films d'action en direct
  • Films d'animation
  • Vidéo de stock
  • Longues vidéos YouTube
  • Vidéos courtes de style TikTok

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Ensemble De Données De Référence Pour La Description Vidéo DREAM-1K | Ensembles de données | HyperAI