HyperAIHyperAI

Hunyuan-GameCraft-1.0 : Cadre De Génération De Vidéos De Jeux Interactifs

1. Introduction au tutoriel

Construire

Hunyuan-GameCraft-1.0 est un framework de génération vidéo de jeux interactifs hautement dynamique, lancé conjointement par l'équipe Tencent Hunyuan et l'Université des Sciences et Technologies de Huazhong en août 2025. Basé sur l'unification des entrées clavier et souris dans un espace de représentation de caméra partagé, il permet un contrôle précis des mouvements et prend en charge les entrées interactives complexes. Ce framework introduit une stratégie d'apprentissage par conditions historiques mixtes permettant d'étendre de manière autorégressive les séquences vidéo, de conserver les informations des scènes de jeu et d'assurer une cohérence temporelle à long terme. Basé sur la technologie de distillation de modèles, Hunyuan-GameCraft-1.0 améliore significativement la vitesse d'inférence et est adapté au déploiement en temps réel dans des environnements interactifs complexes. Le modèle est entraîné sur un jeu de données AAA à grande échelle et démontre une excellente fidélité visuelle, une authenticité et une excellente contrôlabilité des mouvements, surpassant largement les modèles existants. Les résultats de l'article sont les suivants :Hunyuan-GameCraft : Génération de vidéos de jeux interactifs hautement dynamiques avec condition d'historique hybride".

Ce tutoriel utilise quatre cartes graphiques RTX 4090 comme ressources de calcul.

2. Affichage des effets

3. Étapes de l'opération

1. Démarrez le conteneur

2. Étapes d'utilisation

Si le message « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Le modèle étant volumineux, veuillez patienter 5 à 6 minutes avant d'actualiser la page. Assurez-vous que l'initialisation du modèle est terminée avant d'utiliser l'interface Gradio.

Remarque : Plus le nombre d'étapes d'inférence/images vidéo est élevé, meilleur est l'effet généré, mais plus le temps de génération de l'inférence est long. Veuillez définir les étapes d'inférence/images vidéo de manière appropriée (avec 5 étapes d'inférence et 33 images vidéo, la génération d'une vidéo prend environ 15 minutes).

Paramètres spécifiques :

  • Sélectionner les actions (liste d'actions) :
    • avancer : Avancer en ligne droite le long de la direction actuelle (directement devant la caméra/le porteur) sans changer de direction.
    • gauche : se déplacer horizontalement vers la gauche de la direction actuelle sans changer la direction.
    • droite : Déplacez-vous horizontalement vers la droite de la direction actuelle sans changer de direction.
    • reculer : Se déplacer vers l'arrière en ligne droite dans la direction opposée à la direction actuelle sans changer de direction.
    • up_rot : fait pivoter l'angle de vue/inclinaison vers le haut autour de l'axe horizontal (inclinaison ↑). Seule la direction de la vue est modifiée, pas la position.
    • right_rot : fait pivoter la caméra vers la droite autour de l'axe vertical (lacet →), en modifiant uniquement l'orientation, pas la position.
    • left_rot : fait pivoter la caméra vers la gauche autour de l'axe vertical (lacet ←), en modifiant uniquement l'orientation, pas la position.
    • down_rot : fait pivoter l'angle de vue/d'inclinaison vers le bas autour de l'axe horizontal (inclinaison↓), en modifiant uniquement la direction de la vue, pas la position.
  • Échelle CFG : contrôle l'influence du mot-clé sur le résultat généré. Plus la valeur est élevée, plus le mot-clé est adapté.
  • Exemple N Frames : le nombre total d'images de la vidéo générée.
  • Étapes d'inférence : nombre d'étapes d'optimisation itératives pour la génération de vidéos.
  • Flow Shift Eval Video : Paramètres qui contrôlent la fluidité de la vidéo.

4. Discussion

🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓

Informations sur la citation

Merci à l'utilisateur Github SuperYang  Déploiement de ce tutoriel. Les informations de citation pour ce projet sont les suivantes :

@misc{li2025hunyuangamecrafthighdynamicinteractivegame,
    title={Hunyuan-GameCraft: High-dynamic Interactive Game Video Generation with Hybrid History Condition}, 
    author={Jiaqi Li and Junshu Tang and Zhiyong Xu and Longhuang Wu and Yuan Zhou and Shuai Shao and Tianbao Yu and Zhiguo Cao and Qinglin Lu},
    year={2025},
    eprint={2506.17201},
    archivePrefix={arXiv},
    primaryClass={cs.CV},
    url={https://arxiv.org/abs/2506.17201}, 
}