RMPE: Regionale Mehrpersonen-Pose-Schätzung

Die Schätzung von Mehrpersonen-Posen in der freien Natur ist eine Herausforderung. Obwohl die neuesten Menschen-Detektoren gute Leistungen gezeigt haben, sind kleine Fehler bei der Lokalisierung und Erkennung unvermeidbar. Diese Fehler können zu Fehlschlägen für einen Einzelpersonen-Pose-Schätzer (SPPE) führen, insbesondere für Methoden, die ausschließlich auf den Ergebnissen der Menschen-Erkennung basieren. In dieser Arbeit schlagen wir ein neuartiges regionales Mehrpersonen-Pose-Schätzungsrahmenwerk (RMPE) vor, um die Posen-Schätzung bei ungenauen Menschen-Bounding-Boxen zu erleichtern. Unser Rahmenwerk besteht aus drei Komponenten: dem symmetrischen räumlichen Transformer-Netzwerk (SSTN), der parametrischen Pose-Non-Maximum-Suppression (NMS) und dem Pose-gesteuerten Vorschlags-Generator (PGPG). Unsere Methode ist in der Lage, ungenaue Bounding-Boxen und redundante Erkennungen zu verarbeiten, was es ermöglicht, im Vergleich zu den neuesten Methoden auf dem MPII-Datensatz (Mehrpersonen) eine Steigerung des mAP um 17 % zu erzielen. Unser Modell und unsere Quellcodes sind öffentlich zugänglich.