HyperAIHyperAI

Command Palette

Search for a command to run...

Selbst-bezogene 3D-Mensch-Pose- und Formschätzung aus Videos

Yun-Chun Chen Marco Piccirilli Robinson Piramuthu Ming-Hsuan Yang

Zusammenfassung

Wir betrachten die Aufgabe der Schätzung von 3D-Menschpose und -Form aus Videos. Obwohl bestehende bildbasierte Ansätze erhebliche Fortschritte gemacht haben, werden diese Methoden unabhängig auf jedes Bild angewendet, was oft zu inkonsistenten Vorhersagen führt. In dieser Arbeit präsentieren wir einen videobasierten Lernalgorithmus für die Schätzung von 3D-Menschpose und -Form. Die wesentlichen Erkenntnisse unserer Methode sind zweifach:Erstens, um das Problem inkonsistenter zeitlicher Vorhersagen anzugehen, nutzen wir zeitliche Informationen in Videos und schlagen ein Selbst-Aufmerksamkeitsmodul (self-attention module) vor, das sowohl kurzfristige als auch langfristige Abhängigkeiten zwischen den Bildern berücksichtigt. Dies führt zu zeitlich kohärenten Schätzungen.Zweitens modellieren wir menschliche Bewegung mit einem Vorhersagemodul, das eine glatte Übergangsphase zwischen benachbarten Bildern ermöglicht. Wir evaluieren unsere Methode anhand der Datensätze 3DPW, MPI-INF-3DHP und Human3.6M. Ausführliche experimentelle Ergebnisse zeigen, dass unser Algorithmus sich günstig gegenüber den Stand-der-Technik-Methoden verhält.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp