HyperAIHyperAI

Command Palette

Search for a command to run...

DLow: Diversifizierung latenter Flows für die vielfältige Vorhersage menschlicher Bewegungen

Ye Yuan Kris Kitani

Zusammenfassung

Tiefen generative Modelle werden häufig zur Vorhersage menschlicher Bewegungen eingesetzt, da sie die Modellierung mehrmodaler Datenausbreitungen ermöglichen und eine Vielzahl menschlichen Verhaltens erfassen können. Obwohl erhebliche Anstrengungen unternommen wurden, um tiefe generative Modelle zu entwerfen und zu trainieren, bleibt die effiziente Erzeugung vielfältiger Proben aus einem bereits trainierten tiefen generativen Modell weiterhin ein untererforschtes Problem. Um Proben aus einem vortrainierten generativen Modell zu erhalten, ziehen die meisten bestehenden Ansätze zur generativen Bewegungsvorhersage unabhängige, gaußverteilte latente Codes und wandeln diese in Bewegungsproben um. Dieser zufällige Stichprobenansatz ist jedoch nicht garantiert, vielfältige Proben zu erzeugen, und zwar aus zwei Gründen: (1) Die unabhängige Stichprobe kann die Vielfalt der Proben nicht erzwingen; (2) Die Stichprobe basiert ausschließlich auf der Likelihood, was dazu führen kann, dass nur Proben erzeugt werden, die den Hauptmodi der Datenausbreitung entsprechen. Um diese Probleme zu lösen, schlagen wir eine neuartige Stichprobenmethode, Diversifying Latent Flows (DLow), vor, um eine vielfältige Menge von Proben aus einem vortrainierten tiefen generativen Modell zu erzeugen. Im Gegensatz zur zufälligen (unabhängigen) Stichprobe zieht die vorgeschlagene DLow-Stichprobenmethode eine einzige zufällige Variable und transformiert sie mittels einer Reihe lernbarer Abbildungsfunktionen in eine Menge korrelierter latenter Codes. Diese korrelierten latente Codes werden anschließend decodiert, um eine Menge korrelierter Proben zu erzeugen. Während des Trainings nutzt DLow eine vielfaltfördernde Prior über die Proben als Zielsetzung, um die latenten Abbildungen zu optimieren und die Vielfalt der Proben zu verbessern. Die Gestaltung der Prior ist äußerst flexibel und kann anpassbar gestaltet werden, um diverse Bewegungen mit gemeinsamen Merkmalen zu erzeugen (z. B. ähnliche Beinbewegung, aber unterschiedliche Oberkörperbewegung). Unsere Experimente zeigen, dass DLow die state-of-the-art-Baselines hinsichtlich der Probenvielfalt und Genauigkeit übertrifft. Der Quellcode ist auf der Projektseite verfügbar: https://www.ye-yuan.com/dlow.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp