Eine intuitive und unbeschränkte 2D-Würfel-Darstellung für die gleichzeitige Kopferkennung und -haltungsschätzung

Die meisten aktuellen Methoden zur Schätzung der Kopfhaltung (Head Pose Estimation, HPE) basieren auf der Darstellung durch Eulersche Winkel. Um das inhärente Problem der Mehrdeutigkeit von Rotationsetiketten zu vermeiden, werden alternative quaternionbasierte und vektorbasierte Darstellungen eingeführt. Diese sind jedoch nicht visuell intuitiv und werden oft aus mehrdeutigen Eulerschen Winkeln abgeleitet. In dieser Arbeit präsentieren wir eine neuartige einstufige Methode basierend auf Schlüsselpunkten durch eine {\it intuitive} und {\it unbeschränkte} 2D-Würfelsdarstellung für die gleichzeitige Kopferkennung und -haltungsschätzung. Der 2D-Würfel ist eine orthogonale Projektion des 3D-regulären Hexaeders, das den Kopf grob umschließt, und enthält selbst die Kopflage. Er kann die Kopforientierung in jedem Rotationswinkel eindeutig und direkt widerspiegeln. Im Gegensatz zur allgemeinen 6-fachen Freiheitsgrad-Objekthaltungsschätzung ignorieren wir bei unserem 2D-Würfel die 3-fachen Freiheitsgrade der Kopfgröße, behalten aber die 3-fachen Freiheitsgrade der Kopfhaltung bei. Basierend auf dem Prioritätsprinzip gleicher Kantenlängen können wir die geschlossene Formlösung für Eulersche Winkel aus dem vorhergesagten 2D-Kopfwürfel leicht erhalten, anstatt den fehleranfälligen PnP-Algorithmus anzuwenden. In Experimenten erzielt unsere vorgeschlagene Methode vergleichbare Ergebnisse mit anderen repräsentativen Methoden auf den öffentlichen AFLW2000- und BIWI-Datensätzen. Zudem zeigt ein neuer Test am CMU-Panoptic-Datensatz, dass unsere Methode nahtlos an die unbeschränkte volle Sicht HPE-Aufgabe angepasst werden kann, ohne Modifikationen zu erfordern.