HyperAIHyperAI

Command Palette

Search for a command to run...

Poseur: Direkte menschliche Pose-Regression mit Transformers

Weian Mao Yongtao Ge Chunhua Shen Zhi Tian Xinlong Wang Zhibin Wang Anton van den Hengel

Zusammenfassung

Wir schlagen einen direkten, regressionsbasierten Ansatz zur 2D-Menschenpose-Schätzung aus Einzelbildern vor. Wir formulieren das Problem als Sequenzvorhersageaufgabe, die wir mit einem Transformer-Netzwerk lösen. Dieses Netzwerk lernt direkt eine Regressionsabbildung von Bildern auf die Koordinaten der Schlüsselpunkte, ohne auf Zwischendarstellungen wie Heatmaps zurückzugreifen. Dieser Ansatz vermeidet viel der Komplexität, die mit heatmapbasierten Methoden verbunden ist. Um die Probleme der Merkmalsmisalignierung bei früheren regressionsbasierten Methoden zu überwinden, schlagen wir eine Aufmerksamkeitsmechanik vor, die adaptiv diejenigen Merkmale herausgreift, die am relevantesten für die Ziel-Schlüsselpunkte sind, wodurch die Genauigkeit erheblich gesteigert wird. Wichtig ist, dass unser Framework end-to-end differenzierbar ist und natürlicherweise die Abhängigkeiten zwischen den Schlüsselpunkten lernt. Experimente auf den beiden führenden Pose-Schätzungs-Datensätzen MS-COCO und MPII zeigen, dass unsere Methode die bisherigen State-of-the-Art-Methoden in der regressionsbasierten Pose-Schätzung deutlich übertreffen. Besonders hervorzuheben ist, dass es sich hierbei um den ersten regressionsbasierten Ansatz handelt, der im Vergleich zu den besten heatmapbasierten Methoden konkurrenzfähig ist.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp