HyperAIHyperAI
vor 9 Tagen

OmniPose: Ein mehrskaliges Framework für die Mehrpersonen-Poseschätzung

Bruno Artacho, Andreas Savakis
OmniPose: Ein mehrskaliges Framework für die Mehrpersonen-Poseschätzung
Abstract

Wir stellen OmniPose vor, einen einphasigen, end-to-end trainierbaren Rahmenwerk, der state-of-the-art Ergebnisse für die Mehrpersonen-Pose-Schätzung erzielt. Mittels eines neuartigen Wasserfallmoduls nutzt die OmniPose-Architektur mehrskalige Merkmalsdarstellungen, die die Effektivität der Backbone-Merkmalsextraktoren erhöhen, ohne dass Nachverarbeitung erforderlich ist. OmniPose integriert kontextuelle Informationen über Skalen hinweg und kombiniert Gelenklokalisierung mit Gauss-Heatmap-Modulation im mehrskaligen Merkmalsextraktor, um menschliche Pose mit state-of-the-art Genauigkeit zu schätzen. Die durch das verbesserte Wasserfallmodul in OmniPose erzeugten mehrskaligen Darstellungen nutzen die Effizienz der fortschreitenden Filterung in der Kaskadenarchitektur, während sie gleichzeitig mehrskalige Gesichtsfelder aufrechterhalten, die vergleichbar sind mit den Konfigurationen einer räumlichen Pyramide. Unsere Ergebnisse auf mehreren Datensätzen zeigen, dass OmniPose mit einem verbesserten HRNet-Backbone und Wasserfallmodul eine robuste und effiziente Architektur für die Mehrpersonen-Pose-Schätzung darstellt, die state-of-the-art Ergebnisse erzielt.

OmniPose: Ein mehrskaliges Framework für die Mehrpersonen-Poseschätzung | Neueste Forschungsarbeiten | HyperAI