Command Palette
Search for a command to run...
Convolutional Pose Machines
Convolutional Pose Machines
Wei Shih-En Ramakrishna Varun Kanade Takeo Sheikh Yaser
Zusammenfassung
Pose Machines bieten einen sequentiellen Vorhersageansatz zur Lernung reicher impliziter räumlicher Modelle. In dieser Arbeit stellen wir einen systematischen Entwurf vor, wie konvolutionale Netzwerke in das Pose-Machine-Framework integriert werden können, um Bildmerkmale und bildabhängige räumliche Modelle für die Aufgabe der Pose-Schätzung zu lernen. Der Beitrag dieses Beitrags besteht darin, langreichweitige Abhängigkeiten zwischen Variablen in strukturierten Vorhersageaufgaben wie der geschlossenen Pose-Schätzung implizit zu modellieren. Dies erreichen wir durch die Entwicklung einer sequentiellen Architektur aus konvolutionalen Netzwerken, die direkt auf Glaubwürdigkeitskarten aus vorherigen Stufen operieren und schrittweise verfeinerte Schätzungen für Teilpositionen liefern, ohne dass ein expliziter Inferenzprozess im Sinne grafischer Modelle erforderlich ist. Unser Ansatz bewältigt die typische Schwierigkeit des Verschwindens von Gradienten während des Trainings, indem er eine natürliche Lernziel-Funktion bereitstellt, die eine Zwischenüberwachung erzwingt und somit die rückwärts propagierten Gradienten wieder auffüllt und den Lernprozess konditioniert. Wir demonstrieren einen Stand der Technik (state-of-the-art)-Leistungsstand und überbieten konkurrierende Methoden auf Standardbenchmarks wie den MPII-, LSP- und FLIC-Datensätzen.