Schnelle Schätzung der menschlichen Körperhaltung

Bestehende Ansätze zur Schätzung menschlicher Körperhaltungen betrachten häufig nur, wie die Generalisierungsfähigkeit des Modells verbessert werden kann, aber vernachlässigen dabei das effizienztechnische Problem. Dies führt zur Entwicklung schwerer Modelle, die in der Praxis eine geringe Skalierbarkeit und Kosteneffizienz aufweisen. In dieser Arbeit untersuchen wir das bisher wenig erforschte, aber praktisch entscheidende Problem der Effizienz von Pose-Modellen. Zu diesem Zweck stellen wir eine neue Strategie für das Lernen von Modellen vor: Fast Pose Distillation (FPD). Insbesondere trainiert FPD eine leichte neuronale Netzarchitektur zur Schätzung von Körperhaltungen, die schnell ausgeführt werden kann und einen geringen Rechenaufwand erfordert. Dies wird durch die effektive Übertragung des Wissens über die Pose-Struktur eines starken Lehrernetzes erreicht. Umfangreiche Evaluierungen zeigen die Vorteile unserer FPD-Methode im Vergleich zu einer Vielzahl von Stand-of-the-Art-Ansätzen zur Schätzung menschlicher Körperhaltungen hinsichtlich der Kosteneffizienz des Modells auf zwei Standard-Benchmark-Datensätzen, dem MPII Human Pose und dem Leeds Sports Pose.