HyperAIHyperAI
vor 2 Monaten

Faltungs-basierte Pose-Maschinen

Wei, Shih-En ; Ramakrishna, Varun ; Kanade, Takeo ; Sheikh, Yaser
Faltungs-basierte Pose-Maschinen
Abstract

Pose Machines bieten einen sequentiellen Vorhersagerahmen für das Lernen von reichhaltigen impliziten räumlichen Modellen. In dieser Arbeit zeigen wir eine systematische Architektur, wie Faltungsnetze (Convolutional Networks) in den Pose Machine-Rahmen integriert werden können, um Bildmerkmale und bildabhängige räumliche Modelle für die Aufgabe der Pose-Schätzung zu lernen. Der Beitrag dieses Papers besteht darin, langreichweitige Abhängigkeiten zwischen Variablen in strukturierten Vorhersageaufgaben wie der Schätzung von Artikulationsposen implizit zu modellieren. Dies erreichen wir durch die Gestaltung einer sequentiellen Architektur, die aus Faltungsnetzen besteht, die direkt auf Glaubenskarten (Belief Maps) aus vorherigen Stufen operieren und zunehmend verfeinerte Schätzungen für die Positionen von Körperteilen erzeugen, ohne dass explizite graphische Modell-Inferenz erforderlich ist. Unser Ansatz begegnet dem charakteristischen Problem verschwindender Gradienten während des Trainings, indem er eine natürliche Lernziel-Funktion bereitstellt, die Zwischenaufsicht durchsetzt. Dies führt zur Wiederherstellung zurückpropagierter Gradienten und konditioniert das Lernverfahren. Wir demonstrieren Spitzenleistung und übertreffen konkurrierende Methoden auf Standard-Benchmarks, einschließlich der MPII-, LSP- und FLIC-Datensätze.