HyperAIHyperAI

Command Palette

Search for a command to run...

Ein generischer diffusionbasierter Ansatz zur 3D-Gestenprädiktion menschlicher Körperhaltungen in freier Umgebung

Saeed Saadatnejad Ali Rasekh Mohammadreza Mofayezi Yasamin Medghalchi Sara Rajabzadeh Taylor Mordan Alexandre Alahi

Zusammenfassung

Die Vorhersage von 3D-Menschenpose in realen Szenarien, auch bekannt als Human-Pose-Vorhersage, ist unvermeidlich Rauschen in den Eingabedaten ausgesetzt, das durch ungenaue 3D-Pose-Schätzungen und Verdeckungen entsteht. Um diesen Herausforderungen zu begegnen, stellen wir einen diffusionbasierten Ansatz vor, der gegebene verrauschte Beobachtungen vorhersagen kann. Wir formulieren die Vorhersageaufgabe als ein Entrauschungsproblem, bei dem sowohl Beobachtung als auch Vorhersage als eine einzige Sequenz mit fehlenden Elementen (entweder in der Beobachtungs- oder der Vorhersageperiode) betrachtet werden. Alle fehlenden Elemente werden als Rauschen behandelt und mit unserem bedingten Diffusionsmodell entrauscht. Um die Leistung bei langfristiger Vorhersage zu verbessern, präsentieren wir ein zeitlich kaskadiertes Diffusionsmodell. Wir zeigen die Vorteile unseres Ansatzes an vier öffentlich verfügbaren Datensätzen (Human3.6M, HumanEva-I, AMASS und 3DPW), wobei wir die derzeit beste Leistung erreichen. Zudem zeigen wir, dass unser Framework generisch genug ist, um jedes 3D-Pose-Vorhersagemodell als Vorverarbeitungsschritt zur Reparatur der Eingaben und als Nachverarbeitungsschritt zur Verfeinerung der Ausgaben zu verbessern. Der Quellcode ist online verfügbar: \url{https://github.com/vita-epfl/DePOSit}.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Ein generischer diffusionbasierter Ansatz zur 3D-Gestenprädiktion menschlicher Körperhaltungen in freier Umgebung | Paper | HyperAI