HyperAIHyperAI

Command Palette

Search for a command to run...

Convolutional Pose Machines

Wei Shih-En Ramakrishna Varun Kanade Takeo Sheikh Yaser

Zusammenfassung

Pose Machines bieten einen sequentiellen Vorhersageansatz zur Lernung reicher impliziter räumlicher Modelle. In dieser Arbeit stellen wir einen systematischen Entwurf vor, wie konvolutionale Netzwerke in das Pose-Machine-Frame­work integriert werden können, um Bildmerkmale und bildabhängige räumliche Modelle für die Aufgabe der Pose-Schätzung zu lernen. Der Beitrag dieses Beitrags besteht darin, langreichweitige Abhängigkeiten zwischen Variablen in strukturierten Vorhersageaufgaben wie der geschlossenen Pose-Schätzung implizit zu modellieren. Dies erreichen wir durch die Entwicklung einer sequentiellen Architektur aus konvolutionalen Netzwerken, die direkt auf Glaubwürdigkeitskarten aus vorherigen Stufen operieren und schrittweise verfeinerte Schätzungen für Teilpositionen liefern, ohne dass ein expliziter Inferenzprozess im Sinne grafischer Modelle erforderlich ist. Unser Ansatz bewältigt die typische Schwierigkeit des Verschwindens von Gradienten während des Trainings, indem er eine natürliche Lernziel-Funktion bereitstellt, die eine Zwischenüberwachung erzwingt und somit die rückwärts propagierten Gradienten wieder auffüllt und den Lernprozess konditioniert. Wir demonstrieren einen Stand der Technik (state-of-the-art)-Leistungsstand und überbieten konkurrierende Methoden auf Standardbenchmarks wie den MPII-, LSP- und FLIC-Datensätzen.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp