HyperAIHyperAI
vor 2 Monaten

Bedingte Fluss-Variationsautoencoder für die Vorhersage strukturierter Sequenzen

Apratim Bhattacharyya; Michael Hanselmann; Mario Fritz; Bernt Schiele; Christoph-Nikolas Straehle
Bedingte Fluss-Variationsautoencoder für die Vorhersage strukturierter Sequenzen
Abstract

Die Vorhersage zukünftiger Zustände der Umgebung und interagierender Agenten ist eine Schlüsselkompetenz, die autonome Agenten benötigen, um im echten Leben erfolgreich zu operieren. Frühere Arbeiten zur strukturierten Sequenzvorhersage basierend auf latenten Variablenmodellen legen eine unimodale Standard-Gauß-Verteilung als A-priori-Verteilung für die latenten Variablen fest. Dies führt zu einem starken Modellbias, der es schwierig macht, die Multimodalität der Verteilung der zukünftigen Zustände vollständig zu erfassen. In dieser Arbeit stellen wir bedingte Fluss-Variationsautoencoder (CF-VAE) vor, die unser neuartiges bedingtes Normalizing-Flow-basiertes A-priori verwenden, um komplexe multimodale bedingte Verteilungen effektiv für strukturierte Sequenzvorhersagen zu erfassen. Darüber hinaus schlagen wir zwei neuartige Regularisierungsschemata vor, die das Training stabilisieren und mit dem Posterior-Collapse umgehen, um ein stabiles Training und eine bessere Anpassung an die Ziel-Datenverteilung zu gewährleisten. Unsere Experimente an drei multimodal strukturierten Sequenzvorhersagedatensätzen – MNIST-Sequenzen, Stanford Drone und HighD – zeigen, dass das vorgeschlagene Verfahren über verschiedene Evaluationsmetriken hinweg den Stand der Technik erreicht.Anmerkungen:- "uni-modal standard Gaussian prior" wurde als "unimodale Standard-Gauß-Verteilung" übersetzt.- "posterior collapse" wurde als "Posterior-Collapse" übersetzt.- Die Datensätze wurden direkt wiedergegeben: "MNIST-Sequenzen", "Stanford Drone" und "HighD".

Bedingte Fluss-Variationsautoencoder für die Vorhersage strukturierter Sequenzen | Neueste Forschungsarbeiten | HyperAI