vor 5 Monaten

Zusammenfassung

Die Generierung langer Videos ist grundsätzlich ein Problem des langfristigen Kontextgedächtnisses: Modelle müssen bedeutende Ereignisse über einen langen Zeitraum hinweg speichern und abrufen, ohne dass die Repräsentation kollabiert oder verschwimmt. Die Skalierung von Diffusions-Transformern zur Erzeugung von Videos mit langem Kontext ist jedoch grundlegend durch die quadratische Kostenstruktur der Selbst-Attention begrenzt, was die Speicherung und Berechnung für lange Sequenzen unpraktisch und schwer zu optimieren macht. Wir reformulieren die Aufgabe der langfristigen Videoerzeugung als interne Informationsabrufaufgabe und stellen einen einfachen, lernbaren, sparsen Attention-Routing-Modul namens Mixture of Contexts (MoC) vor, der als effiziente Langzeitgedächtnis-Abfrageeinheit dient. In MoC wählt jeder Query dynamisch einige informative Fragmente sowie obligatorische Anchor-Elemente (Caption, lokale Fenster) aus, auf die er sich konzentriert, wobei eine kausale Routing-Strategie Schleifenbildung verhindert. Bei der Skalierung der Daten und schrittweiser Verdünnung des Routing-Mechanismus richtet das Modell seine Berechnungsressourcen gezielt auf die relevanten Teile der Vergangenheit aus, wodurch Identitäten, Aktionen und Szenen über mehrere Minuten hinweg erhalten bleiben. Die Effizienz ergibt sich als Nebenwirkung des Abrufsverfahrens (nahezu lineare Skalierbarkeit), was eine praktikable Trainings- und Synthesemöglichkeit ermöglicht und das Auftreten von Gedächtnis und Konsistenz in der Größenordnung von Minuten ermöglicht.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 5 Monaten

Shengqu Cai Ceyuan Yang Lvmin Zhang Yuwei Guo Junfei Xiao et al

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 5 Monaten

Shengqu Cai Ceyuan Yang Lvmin Zhang Yuwei Guo Junfei Xiao et al

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Mischung von Kontexten für die Generierung langer Videos | Paper | HyperAI

Command Palette

Mischung von Kontexten für die Generierung langer Videos

Shengqu Cai Ceyuan Yang Lvmin Zhang Yuwei Guo Junfei Xiao et al

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Mischung von Kontexten für die Generierung langer Videos

Shengqu Cai Ceyuan Yang Lvmin Zhang Yuwei Guo Junfei Xiao et al

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Mischung von Kontexten für die Generierung langer Videos

Shengqu Cai Ceyuan Yang Lvmin Zhang Yuwei Guo Junfei Xiao et al

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters