HyperAIHyperAI

Command Palette

Search for a command to run...

vor 9 Tagen

HoloCine: Holistische Generierung kinematografischer, mehrfach geschnittener, langer Videonarrativen

HoloCine: Holistische Generierung kinematografischer, mehrfach geschnittener, langer Videonarrativen

Abstract

Zustandsbestimmende Text-zu-Video-Modelle sind hervorragend darin, isolierte Clips zu generieren, verfehlen jedoch die Erstellung kohärenter, mehrszeniger Erzählungen – jenes Kernstücks der Geschichtenerzählung. Wir schließen diese „Erzählungslücke“ mit HoloCine, einem Modell, das ganze Szenen ganzheitlich generiert, um eine globale Konsistenz von der ersten bis zur letzten Szene zu gewährleisten. Unser Architekturansatz ermöglicht präzise regisseurische Steuerung durch eine Window Cross-Attention-Mechanismus, der Textprompts gezielt auf bestimmte Szenen lokalisiert, während ein spärlicher Inter-Szene-Self-Attention-Muster (dicht innerhalb, spärlich zwischen Szenen) die Effizienz für die Generierung von Minutenlänge gewährleistet. Neben der Erreichung eines neuen State-of-the-Art in Bezug auf narrative Kohärenz entwickelt HoloCine bemerkenswerte emergente Fähigkeiten: eine persistente Erinnerung an Charaktere und Szenen sowie ein intuitives Verständnis kamerabasiertes Erzähltechniken. Unsere Arbeit markiert einen entscheidenden Wandel von der Clip-Synthese hin zur automatisierten Filmproduktion und macht die end-to-end-kreative Filmgestaltung zu einer greifbaren Zukunft. Unser Code ist verfügbar unter: https://holo-cine.github.io/.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
HoloCine: Holistische Generierung kinematografischer, mehrfach geschnittener, langer Videonarrativen | Forschungsarbeiten | HyperAI