HyperAIHyperAI

Command Palette

Search for a command to run...

Verbesserte bedingte VRNNs für Videovorhersage

Lluís Castrejón Nicolas Ballas Aaron Courville

Zusammenfassung

Die Vorhersage zukünftiger Frames für eine Videosequenz ist eine anspruchsvolle Aufgabe des generativen Modellierens. Versprechende Ansätze umfassen wahrscheinlichkeitstheoretische Latenten-Variablen-Modelle wie den Variational Auto-Encoder (VAE). Obwohl VAEs Unsicherheiten bewältigen und mehrere mögliche zukünftige Ausgänge modellieren können, neigen sie dazu, unscharfe Vorhersagen zu erzeugen. In dieser Arbeit argumentieren wir, dass dies ein Zeichen von Underfitting ist. Um dieses Problem anzugehen, schlagen wir vor, die Ausdrucksfähigkeit der latenten Verteilungen zu erhöhen und Likelihood-Modelle mit höherer Kapazität zu verwenden. Unser Ansatz basiert auf einer Hierarchie von latenten Variablen, die eine Familie flexibler A-priori- und A-posteriori-Verteilungen definiert, um die Wahrscheinlichkeit zukünftiger Sequenzen besser zu modellieren. Wir überprüfen unseren Vorschlag durch eine Reihe von Abschätzungsexperimenten (Ablation Experiments) und vergleichen unsere Methode mit aktuellen state-of-the-art Latenten-Variablen-Modellen. Unsere Methode erzielt günstige Ergebnisse unter verschiedenen Metriken in drei unterschiedlichen Datensätzen.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Verbesserte bedingte VRNNs für Videovorhersage | Paper | HyperAI