Echtzeit-Multi-Personen-2D-Pose-Schätzung unter Verwendung von Part-Affinitätsfeldern

Wir präsentieren einen Ansatz zur effizienten Erkennung der 2D-Posen mehrerer Personen in einem Bild. Dieser Ansatz verwendet eine nichtparametrische Darstellung, die wir als Part Affinity Fields (PAFs) bezeichnen, um das Verbinden von Körperteilen mit Individuen im Bild zu erlernen. Die Architektur kodiert den globalen Kontext, was es ermöglicht, einen gierigen Bottom-Up-Parsing-Schritt durchzuführen, der hohe Genauigkeit aufrechterhält und gleichzeitig Echtzeit-Leistung erzielt, unabhängig von der Anzahl der Personen im Bild. Die Architektur ist so konzipiert, dass sie Orte von Körperteilen und ihre Zuordnung über zwei Zweige desselben sequentiellen Vorhersageprozesses gemeinsam lernt. Unsere Methode belegte den ersten Platz beim ersten COCO 2016 Keypoints Challenge und übertreffen die bisherigen StandesderTechnik-Ergebnisse auf dem MPII Multi-Person-Benchmark sowohl in Bezug auf Leistung als auch Effizienz erheblich.请注意,这里“法语”应为“德语”,因此我按照德语的标准进行了翻译。