6DoF-Head-Pose-Schätzung durch explizite bidirektionale Interaktion mit der Gesichtsgeometrie

Diese Studie behandelt die nuancierte Herausforderung der Schätzung von Kopfverschiebungen im Kontext der sechs-freiheitsgrad-basierten (6DoF) Kopfhaltungsschätzung und legt dabei den Fokus auf dieses Aspekt, anstatt sich wie üblich mehr auf die Kopfdrehungen zu konzentrieren. Wir haben eine Lücke in den bestehenden Methodologien identifiziert und das untergenutzte Synergiepotenzial zwischen Gesichtsgeometrie und Kopfverschiebung erkannt. Um diese Lücke zu schließen, schlagen wir einen neuen Ansatz vor, das sogenannte Head Translation, Rotation, and face Geometry Netzwerk (TRG), das durch seine explizite bidirektionale Interaktionsstruktur hervorsticht. Diese Struktur wurde sorgfältig entwickelt, um die komplementäre Beziehung zwischen Gesichtsgeometrie und Kopfverschiebung optimal auszunutzen und stellt damit einen bedeutenden Fortschritt im Bereich der Kopfhaltungsschätzung dar. Zu unseren Beiträgen zählen auch die Entwicklung einer Strategie zur Schätzung von Korrekturparametern für Begrenzungsrahmen sowie eine Technik zur Anpassung von Landmarken an das Bild. Beide Innovationen zeigen in 6DoF-Kopfhaltungsschätz-Aufgaben überlegene Leistungen. Ausführliche Experimente mit den Datensätzen ARKitFace und BIWI bestätigen, dass das vorgeschlagene Verfahren den aktuellen Stand der Technik übertrifft. Der Quellcode ist unter https://github.com/asw91666/TRG-Release veröffentlicht.