HyperAIHyperAI
vor einem Monat

Tiefes Hochauflösendes Repräsentationslernen für die Schätzungen der menschlichen Körperhaltung

Ke Sun; Bin Xiao; Dong Liu; Jingdong Wang
Tiefes Hochauflösendes Repräsentationslernen für die Schätzungen der menschlichen Körperhaltung
Abstract

Dies ist eine offizielle PyTorch-Implementierung des Verfahrens zur tiefen Hochauflösenden Repräsentationslernen für die menschliche Pose-Schätzung (Deep High-Resolution Representation Learning for Human Pose Estimation). In dieser Arbeit befassen wir uns mit dem Problem der menschlichen Pose-Schätzung, wobei der Fokus auf dem Lernen zuverlässiger Hochauflösungsrepräsentationen liegt. Die meisten existierenden Methoden rekonstruieren Hochauflösungsrepräsentationen aus den von einem Hoch-nach-Niedrig-Auflösungsnetzwerk erzeugten Niedrigauflösungsrepräsentationen. Im Gegensatz dazu behält unser vorgeschlagenes Netzwerk die Hochauflösungsrepräsentationen über den gesamten Prozess bei. Wir beginnen mit einem Hochauflösungssubnetz als erstes Stadium, fügen schrittweise weitere Subnetze hinzu, die von Hoch- zu Niedrigauflösung arbeiten, um mehr Stadien zu bilden, und verbinden die Multiskalen-Subnetze parallel. Wir führen wiederholte Multiskalenfusionen durch, sodass jede der Hoch-nach-Niedrig-Auflösungsrepräsentationen kontinuierlich Informationen von anderen parallelen Repräsentationen erhält, was zu reichhaltigen Hochauflösungsrepräsentationen führt. Als Ergebnis ist das vorhergesagte Keypoint-Heatmap potentiell genauer und räumlich präziser. Wir demonstrieren empirisch die Effektivität unseres Netzwerks durch überlegene Pose-Schätzresultate auf zwei Benchmark-Datensätzen: dem COCO Keypoint Detection Datensatz und dem MPII Human Pose Datensatz. Der Code und die Modelle sind öffentlich verfügbar unter \url{https://github.com/leoxiaobin/deep-high-resolution-net.pytorch}.

Tiefes Hochauflösendes Repräsentationslernen für die Schätzungen der menschlichen Körperhaltung | Neueste Forschungsarbeiten | HyperAI