Hunyuan-GameCraft-1.0: Framework Zur Interaktiven Spielvideogenerierung
1. Einführung in das Tutorial

Hunyuan-GameCraft-1.0 ist ein hochdynamisches Framework zur interaktiven Spielevideogenerierung, das im August 2025 gemeinsam vom Tencent Hunyuan-Team und der Huazhong University of Science and Technology veröffentlicht wurde. Durch die Zusammenführung von Tastatur- und Mauseingaben in einem gemeinsamen Kameradarstellungsraum ermöglicht es eine präzise Bewegungssteuerung und unterstützt komplexe interaktive Eingaben. Das Framework führt eine Trainingsstrategie mit gemischten Verlaufsbedingungen ein, die Videosequenzen autoregressiv erweitern, Spielszeneninformationen speichern und langfristige zeitliche Kohärenz gewährleisten kann. Basierend auf der Technologie der Modelldestillation verbessert Hunyuan-GameCraft-1.0 die Inferenzgeschwindigkeit deutlich und eignet sich für den Echtzeiteinsatz in komplexen interaktiven Umgebungen. Das Modell wird anhand eines umfangreichen AAA-Spieledatensatzes trainiert und zeigt hervorragende visuelle Wiedergabetreue, Authentizität und Bewegungssteuerbarkeit, wodurch es bestehende Modelle deutlich übertrifft. Die relevanten Ergebnisse der Studie lauten:Hunyuan-GameCraft: Hochdynamische interaktive Spielvideogenerierung mit hybrider Verlaufsbedingung".
Dieses Tutorial verwendet vier RTX 4090-Grafikkarten als Rechenressourcen.
2. Effektanzeige

3. Bedienungsschritte
1. Starten Sie den Container

2. Anwendungsschritte
Wenn „Bad Gateway“ angezeigt wird, bedeutet dies, dass das Modell initialisiert wird. Da das Modell groß ist, warten Sie bitte etwa 5-6 Minuten und aktualisieren Sie die Seite. Stellen Sie sicher, dass die Modellinitialisierung abgeschlossen ist, bevor Sie die Gradio-Oberfläche bedienen.
Hinweis: Je mehr Inferenzschritte/Videobilder vorhanden sind, desto besser ist der generierte Effekt, desto länger dauert aber auch die Inferenzgenerierung. Bitte legen Sie die Inferenzschritte/Videobilder entsprechend fest (bei 5 Inferenzschritten und 33 Videobildern dauert die Generierung eines Videos etwa 15 Minuten).



Spezifische Parameter:
- Aktionen auswählen (Aktionsliste):
- vorwärts: Bewegen Sie sich in einer geraden Linie entlang der aktuellen Richtung vorwärts (direkt vor der Kamera/dem Träger), ohne die Richtung zu ändern.
- links: Horizontal nach links von der aktuellen Richtung bewegen, ohne die Richtung zu ändern.
- rechts: Horizontal nach rechts von der aktuellen Richtung bewegen, ohne die Richtung zu ändern.
- rückwärts: Bewegen Sie sich in einer geraden Linie in die entgegengesetzte Richtung der aktuellen Richtung rückwärts, ohne die Richtung zu ändern.
- up_rot: Dreht den Blick-/Neigungswinkel um die horizontale Achse nach oben (Neigung ↑). Dabei wird nur die Blickrichtung geändert, nicht die Position.
- right_rot: Dreht die Kamera nach rechts um die vertikale Achse (Gier →), wobei nur die Ausrichtung, nicht die Position geändert wird.
- left_rot: Dreht die Kamera nach links um die vertikale Achse (Gier ←) und ändert nur die Ausrichtung, nicht die Position.
- down_rot: Dreht den Blick-/Neigungswinkel um die horizontale Achse nach unten (Neigung↓) und ändert dabei nur die Blickrichtung, nicht die Position.
- CFG-Skala: Steuert den Einfluss des Eingabeworts auf das generierte Ergebnis. Je größer der Wert, desto besser passt es zum Eingabewort.
- Beispiel N Frames: Die Gesamtzahl der Frames des generierten Videos.
- Inferenzschritte: Die Anzahl der iterativen Optimierungsschritte für die Videogenerierung.
- Flow Shift Eval Video: Parameter, die die Laufruhe des Videos steuern.
4. Diskussion
🖌️ Wenn Sie ein hochwertiges Projekt sehen, hinterlassen Sie bitte im Hintergrund eine Nachricht, um es weiterzuempfehlen! Darüber hinaus haben wir auch eine Tutorien-Austauschgruppe ins Leben gerufen. Willkommen, Freunde, scannen Sie den QR-Code und kommentieren Sie [SD-Tutorial], um der Gruppe beizutreten, verschiedene technische Probleme zu besprechen und Anwendungsergebnisse auszutauschen ↓

Zitationsinformationen
Dank an den Github-Benutzer SuperYang Bereitstellung dieses Tutorials. Die Zitationsinformationen für dieses Projekt lauten wie folgt:
@misc{li2025hunyuangamecrafthighdynamicinteractivegame,
title={Hunyuan-GameCraft: High-dynamic Interactive Game Video Generation with Hybrid History Condition},
author={Jiaqi Li and Junshu Tang and Zhiyong Xu and Longhuang Wu and Yuan Zhou and Shuai Shao and Tianbao Yu and Zhiguo Cao and Qinglin Lu},
year={2025},
eprint={2506.17201},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2506.17201},
}