BlazePose: Echtzeit-Verfolgung von Körperpose auf Geräten

Wir stellen BlazePose vor, eine leichte convolutionale neuronale Netzwerkarchitektur für die menschliche Körperhaltungsbestimmung, die speziell für Echtzeit-Inferenz auf mobilen Geräten optimiert ist. Während der Inferenz generiert das Netzwerk 33 Körper-Schlüsselpunkte für eine einzelne Person und erreicht dabei eine Geschwindigkeit von über 30 Bildern pro Sekunde auf einem Pixel 2-Handy. Dadurch eignet es sich besonders für Anwendungen in Echtzeit, wie beispielsweise die Fitnessverfolgung oder die Erkennung von Gebärdensprache. Zu unseren Hauptbeiträgen zählen eine neuartige Lösung für die Körperhaltungsverfolgung sowie ein leichtgewichtiges Netzwerk zur Körperhaltungsbestimmung, das sowohl Heatmaps als auch Regression auf die Koordinaten der Schlüsselpunkte nutzt.