Zu robusten und unbeschränkten Schätzungen des vollen Drehbereichs von Kopfhaltungen

Die Schätzung der Kopfhaltung einer Person ist ein entscheidendes Problem für zahlreiche Anwendungen, das jedoch noch immer hauptsächlich als Teilbereich der Frontalhaltungsschätzung behandelt wird. Wir präsentieren eine neuartige Methode zur unbeschränkten End-to-End-Schätzung der Kopfhaltung, um die anspruchsvolle Aufgabe der Vorhersage des vollen Orientierungsbereichs der Kopfhaltung zu bewältigen. Um das Problem unspezifischer Rotationslabels anzugehen, führen wir die Formalismen der Rotationsmatrix für unsere Grundwahrheitsdaten ein und schlagen eine kontinuierliche 6D-Rotationsmatrixdarstellung vor, die eine effiziente und robuste direkte Regression ermöglicht. Dies ermöglicht es, die vollständige Rotationserscheinung effizient zu lernen und die Einschränkungen des aktuellen Standes der Technik zu überwinden. Zusammen mit neuen akkumulierten Trainingsdaten, die vollständige Rotationsdaten der Kopfhaltung liefern, und einem geodätischen Verlustansatz für stabiles Lernen gestalten wir ein fortschrittliches Modell, das in der Lage ist, einen erweiterten Bereich von Kopforientierungen vorherzusagen. Eine umfangreiche Evaluierung auf öffentlichen Datensätzen zeigt nachdrücklich, dass unsere Methode anderen Stand-der-Technik-Methoden in einer effizienten und robusten Weise deutlich überlegen ist und dass ihr fortschrittlicher Vorhersagebereich den Anwendungsbereich erweitern kann. Wir stellen unseren Trainings- und Testcode sowie unsere trainierten Modelle unter folgender Open-Source-Lizenz zur Verfügung: https://github.com/thohemp/6DRepNet360.