HyperAIHyperAI

Command Palette

Search for a command to run...

Pose Transformers (POTR): Vorhersage menschlicher Bewegungen mit nicht-autoregressiven Transformers

Angel Martínez-González Michael Villamizar Jean-Marc Odobez

Zusammenfassung

Wir schlagen vor, Transformer-Architekturen für die nicht-autoregressive Vorhersage menschlicher Bewegungen zu nutzen. Unser Ansatz decodiert die Elemente parallel aus einer Abfrage-Sequenz, anstatt wie state-of-the-art RNN-basierte Ansätze auf vorherigen Vorhersagen zu konditionieren. Auf diese Weise ist unser Ansatz rechnerisch weniger aufwendig und vermeidet potenziell die Akkumulation von Fehlern über lange Sequenzabschnitte hinweg. In diesem Kontext erbringen wir vier Beiträge: (i) Wir formulieren die Vorhersage menschlicher Bewegungen als ein Sequenz-zu-Sequenz-Problem und schlagen einen nicht-autoregressiven Transformer vor, um die Folge von Körperhaltungen parallel zu inferieren; (ii) Wir schlagen vor, Sequenzen dreidimensionaler Haltungen aus einer im Voraus generierten Abfrage-Sequenz abzuleiten, die Elemente aus der Eingabesequenz enthält; (iii) Wir schlagen vor, eine gelenkbasierende Aktivitätsklassifikation aus dem Encoder-Speicher durchzuführen, mit der Hoffnung, dass die Aktivitätserkennung die Vorhersagen verbessern kann; (iv) Wir zeigen, dass unser Ansatz trotz seiner Einfachheit auf zwei öffentlichen Datensätzen konkurrenzfähige Ergebnisse erzielt, wobei er überraschenderweise insbesondere für kurzfristige Vorhersagen besser abschneidet als für langfristige.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp