HyperAIHyperAI

Command Palette

Search for a command to run...

Hunyuan-GameCraft-1.0: Framework Zur Interaktiven Spielvideogenerierung

Date

vor 5 Monaten

Size

589.47 MB

License

Other

Paper URL

2506.17201

1. Einführung in das Tutorial

Bauen

Hunyuan-GameCraft-1.0 ist ein Framework zur Generierung hochdynamischer interaktiver Spielvideos, das im August 2025 vom Tencent Hunyuan-Team und der Huazhong University of Science and Technology gemeinsam veröffentlicht wurde. Es ermöglicht eine präzise Bewegungssteuerung und unterstützt komplexe interaktive Eingaben durch die Zusammenführung von Tastatur- und Mauseingaben in einem gemeinsamen Kameradarstellungsraum. Das Framework verwendet eine hybride, historienbasierte Trainingsstrategie, die Videosequenzen autoregressiv erweitert, Informationen zur Spielszene bewahrt und langfristige zeitliche Kohärenz gewährleistet. Dank Modelldestillation verbessert Hunyuan-GameCraft-1.0 die Inferenzgeschwindigkeit deutlich und eignet sich für den Echtzeiteinsatz in komplexen interaktiven Umgebungen. Das Modell wurde mit einem umfangreichen AAA-Spieldatensatz trainiert und demonstriert überlegene visuelle Wiedergabetreue, Realismus und Bewegungssteuerung, wodurch es bestehende Modelle deutlich übertrifft. Entsprechende Forschungsarbeiten sind verfügbar. Hunyuan-GameCraft: Hochdynamische interaktive Spielvideogenerierung mit hybrider Verlaufsbedingung .

Dieses Tutorial verwendet vier RTX 4090-Grafikkarten als Rechenressourcen.

2. Effektanzeige

3. Bedienungsschritte

1. Starten Sie den Container

2. Anwendungsschritte

Wenn „Bad Gateway“ angezeigt wird, bedeutet dies, dass das Modell initialisiert wird. Da das Modell groß ist, warten Sie bitte etwa 5-6 Minuten und aktualisieren Sie die Seite. Stellen Sie sicher, dass die Modellinitialisierung abgeschlossen ist, bevor Sie die Gradio-Oberfläche bedienen.

Hinweis: Je mehr Inferenzschritte/Videobilder vorhanden sind, desto besser ist der generierte Effekt, desto länger dauert aber auch die Inferenzgenerierung. Bitte legen Sie die Inferenzschritte/Videobilder entsprechend fest (bei 5 Inferenzschritten und 33 Videobildern dauert die Generierung eines Videos etwa 15 Minuten).

Spezifische Parameter:

  • Aktionen auswählen (Aktionsliste):
    • vorwärts: Bewegen Sie sich in einer geraden Linie entlang der aktuellen Richtung vorwärts (direkt vor der Kamera/dem Träger), ohne die Richtung zu ändern.
    • links: Horizontal nach links von der aktuellen Richtung bewegen, ohne die Richtung zu ändern.
    • rechts: Horizontal nach rechts von der aktuellen Richtung bewegen, ohne die Richtung zu ändern.
    • rückwärts: Bewegen Sie sich in einer geraden Linie in die entgegengesetzte Richtung der aktuellen Richtung rückwärts, ohne die Richtung zu ändern.
    • up_rot: Dreht den Blick-/Neigungswinkel um die horizontale Achse nach oben (Neigung ↑). Dabei wird nur die Blickrichtung geändert, nicht die Position.
    • right_rot: Dreht die Kamera nach rechts um die vertikale Achse (Gier →), wobei nur die Ausrichtung, nicht die Position geändert wird.
    • left_rot: Dreht die Kamera nach links um die vertikale Achse (Gier ←) und ändert nur die Ausrichtung, nicht die Position.
    • down_rot: Dreht den Blick-/Neigungswinkel um die horizontale Achse nach unten (Neigung↓) und ändert dabei nur die Blickrichtung, nicht die Position.
  • CFG-Skala: Steuert den Einfluss des Eingabeworts auf das generierte Ergebnis. Je größer der Wert, desto besser passt es zum Eingabewort.
  • Beispiel N Frames: Die Gesamtzahl der Frames des generierten Videos.
  • Inferenzschritte: Die Anzahl der iterativen Optimierungsschritte für die Videogenerierung.
  • Flow Shift Eval Video: Parameter, die die Laufruhe des Videos steuern.

4. Diskussion

🖌️ Wenn Sie ein hochwertiges Projekt sehen, hinterlassen Sie bitte im Hintergrund eine Nachricht, um es weiterzuempfehlen! Darüber hinaus haben wir auch eine Tutorien-Austauschgruppe ins Leben gerufen. Willkommen, Freunde, scannen Sie den QR-Code und kommentieren Sie [SD-Tutorial], um der Gruppe beizutreten, verschiedene technische Probleme zu besprechen und Anwendungsergebnisse auszutauschen ↓

Zitationsinformationen

Dank an den Github-Benutzer SuperYang  Bereitstellung dieses Tutorials. Die Zitationsinformationen für dieses Projekt lauten wie folgt:

@misc{li2025hunyuangamecrafthighdynamicinteractivegame,
    title={Hunyuan-GameCraft: High-dynamic Interactive Game Video Generation with Hybrid History Condition}, 
    author={Jiaqi Li and Junshu Tang and Zhiyong Xu and Longhuang Wu and Yuan Zhou and Shuai Shao and Tianbao Yu and Zhiguo Cao and Qinglin Lu},
    year={2025},
    eprint={2506.17201},
    archivePrefix={arXiv},
    primaryClass={cs.CV},
    url={https://arxiv.org/abs/2506.17201}, 
}

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp