HyperAIHyperAI
vor 2 Monaten

CrowdPose: Effiziente Pose-Schätzung in dichten Szenen und eine neue Benchmark

Jiefeng Li; Can Wang; Hao Zhu; Yihuan Mao; Hao-Shu Fang; Cewu Lu
CrowdPose: Effiziente Pose-Schätzung in dichten Szenen und eine neue Benchmark
Abstract

Die Schätzung von Mehrpersonen-Posen ist grundlegend für viele Aufgaben der Computer Vision und hat in den letzten Jahren erhebliche Fortschritte gemacht. Allerdings haben nur wenige frühere Methoden das Problem der Posen-Schätzung in dichten Szenen untersucht, obwohl es in vielen Szenarien herausfordernd und unvermeidlich bleibt. Darüber hinaus können aktuelle Benchmarks eine angemessene Bewertung für solche Fälle nicht bieten. In dieser Arbeit schlagen wir eine neuartige und effiziente Methode vor, um das Problem der Posen-Schätzung in Menschenmengen zu lösen, sowie einen neuen Datensatz, um Algorithmen besser zu evaluieren. Unser Modell besteht aus zwei wesentlichen Komponenten: der Schätzung von Gelenkkandidaten für einzelne Personen (Single Person Pose Estimation, SPPE) und der globalen Zuordnung von maximalen Gelenken. Durch die Vorhersage mehrerer Peaks für jedes Gelenk und die globale Zuordnung unter Verwendung eines Graphenmodells ist unsere Methode robust gegenüber unvermeidlichen Störungen in dichten Szenen und sehr effizient bei der Inferenz. Die vorgeschlagene Methode übertrifft die Stand-of-the-Art-Methoden im CrowdPose-Datensatz um 5,2 mAP, und die Ergebnisse im MSCOCO-Datensatz belegen die Generalisierungsfähigkeit unserer Methode. Der Quellcode und der Datensatz werden öffentlich zugänglich gemacht.