HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données Multivues De Clones De Caméra

Date

il y a 21 heures

Organisation

L'Université de Hong Kong
Université du Zhejiang

URL de l'article

2506.03140

Licence

Apache 2.0

Camera Clone, publié en 2025 par l'Université de Hong Kong en collaboration avec l'Université du Zhejiang, Kuaishou Technology et d'autres institutions, est un ensemble de données vidéo synthétiques à grande échelle rendu à l'aide d'Unreal Engine 5. L'article de recherche associé est intitulé "...".CamCloneMaster : Activation du contrôle de la caméra basé sur des références pour la génération vidéoL'objectif est de prendre en charge l'apprentissage par clonage de caméra, qui reproduit le mouvement de la caméra d'une vidéo de référence tout en conservant le contenu de la scène inchangé, réalisant ainsi la « reproduction du contenu + correspondance du mouvement de la caméra ».

Cet ensemble de données contient 391 000 vidéos, couvrant 39 100 points de prise de vue dynamiques, chacun capturé par 10 caméras simultanées. À partir de ces combinaisons de points de vue, l’ensemble de données comprend 1 154 819 triplets, composés d’une vidéo de référence pour le mouvement de la caméra, d’une vidéo de référence pour le contenu et d’une vidéo cible reproduisant la même trajectoire de caméra.

Aperçu des caractéristiques de l'ensemble de données :

  • Environnement de génération : Toutes les vidéos ont été générées dans 40 scènes 3D de haute qualité.
  • Personnages et actions : Comprend 66 personnages et 93 actions de Fab et Mixamo.
  • Trajectoire de la caméra : Plusieurs types de trajectoires de caméra générées automatiquement sont utilisés, et la même trajectoire est réutilisée à différents endroits pour construire des paires de trajectoires.
  • Configuration des caméras : 10 caméras synchronisées sont déployées sur chaque lieu de prise de vue afin de capturer des données multivues.
  • Spécifications vidéo : La durée est uniformément de 77 images par seconde et 15 FPS ; la résolution est de 1344×768 ou 1008×576, et différents modèles génératifs peuvent être adaptés par recadrage central.
  • Organisation des fichiers : les données sont organisées par date et numéro de piste, chaque dossier de piste contenant toutes les vidéos de points de vue correspondant à cette piste.

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp