Command Palette
Search for a command to run...
Ensemble De Données De Référence Pour La Description Vidéo DREAM-1K
DREAM-1K est un ensemble de données de référence pour la description vidéo publié par ByteDance. Les résultats de l'étude sont les suivants :Tarsier : Recettes pour la formation et l'évaluation de grands modèles de description vidéo".
L'ensemble de données contient 1 000 clips vidéo annotés (d'environ 10 secondes) de complexité variable, répartis en cinq catégories distinctes, chacun contenant au moins un événement dynamique impossible à identifier précisément à partir d'une seule image. Chaque vidéo est accompagnée d'annotations manuelles détaillées couvrant tous les événements, actions et mouvements.
Catégorie de source de données :
- Films d'action en direct
- Films d'animation
- Vidéo de stock
- Longues vidéos YouTube
- Vidéos courtes de style TikTok
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.