HyperAIHyperAI

Command Palette

Search for a command to run...

2D/3D-Pose-Schätzung und Aktionserkennung mit Multitask-Deep-Learning

Diogo C. Luvizon David Picard Hedi Tabia

Zusammenfassung

Aktionserkennung und menschliche Pose-Schätzung sind eng miteinander verbunden, werden aber in der Literatur in der Regel als getrennte Aufgaben behandelt. In dieser Arbeit schlagen wir ein Multitask-Framework vor, das sowohl die 2D- und 3D-Pose-Schätzung aus einzelnen Bildern als auch die Aktionserkennung aus Videosequenzen vereint. Wir zeigen, dass eine einzelne Architektur effizient beide Probleme lösen kann und dennoch Stand-des-Wissens-Ergebnisse erzielt. Darüber hinaus demonstrieren wir, dass eine End-zu-End-Optimierung zu erheblich höherer Genauigkeit führt als getrenntes Lernen. Die vorgeschlagene Architektur kann auf Daten aus verschiedenen Kategorien gleichzeitig und nahtlos trainiert werden. Die auf vier Datensätzen (MPII, Human3.6M, Penn Action und NTU) berichteten Ergebnisse belegen die Effektivität unserer Methode für die gezielten Aufgaben.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp