HyperAIHyperAI
vor 4 Monaten

Tiefe kinematische Pose-Regression

Xingyi Zhou; Xiao Sun; Wei Zhang; Shuang Liang; Yichen Wei
Tiefe kinematische Pose-Regression
Abstract

Das Lernen der Pose von Gelenkobjekten ist an sich schwierig, da die Pose hochdimensional ist, aber viele strukturelle Einschränkungen aufweist. Die meisten existierenden Arbeiten modellieren diese Einschränkungen nicht und garantieren nicht die geometrische Gültigkeit ihrer Pose-Schätzungen. Dies erfordert eine nachfolgende Nachbearbeitung, um die korrekte Geometrie wiederherzustellen, falls gewünscht, was mühsam und suboptimal ist. In dieser Arbeit schlagen wir vor, ein kinematisches Objektmodell direkt in das tiefen neuronalen Netzwerklernen für die allgemeine Pose-Schätzung von Gelenkobjekten zu integrieren. Die kinematische Funktion wird auf den angemessen parametrisierten Bewegungsvariablen des Objekts definiert. Sie ist differenzierbar und kann im Gradientenabstiegs-basierten Optimierungsprozess während des Netzwerktrainings verwendet werden. Das Vorwissen über das geometrische Modell des Objekts wird vollständig genutzt und die Struktur wird garantiert als gültig betrachtet. Wir präsentieren überzeugende Experimentsergebnisse anhand eines Toy-Beispiels und des Problems der 3D-Menschpose-Schätzung. Für letzteres erreichen wir den Stand der Technik auf dem Human3.6M-Datensatz.