HyperAIHyperAI
vor 2 Monaten

Erkennung, Pose-Schätzung und Segmentierung für mehrere Körper: Die virtuelle Schleife schließen

Purkrabek, Miroslav ; Matas, Jiri
Erkennung, Pose-Schätzung und Segmentierung für mehrere Körper: Die virtuelle Schleife schließen
Abstract

Methode zur Schätzung der menschlichen Körperhaltung funktionieren gut bei isolierten Personen, haben jedoch Schwierigkeiten mit Szenarien, in denen mehrere Körper in der Nähe zueinander sind. Frühere Arbeiten haben dieses Problem durch die Bedingung der Körperhaltungsschätzung anhand von erkannten Begrenzungsrahmen oder Schlüsselpunkten angegangen, dabei却被忽略了实例掩码。Wir schlagen vor, iterativ die gegenseitige Konsistenz von Begrenzungsrahmen, Instanzmasken und Körperhaltungen zu gewährleisten. Die vorgestellte Methode BBox-Mask-Pose (BMP) verwendet drei spezialisierte Modelle, die sich gegenseitig in einer geschlossenen Schleife verbessern. Alle Modelle werden für die gegenseitige Bedingung angepasst, was die Robustheit in Mehrkörper-Szenen erhöht. MaskPose, ein neues Modell zur maskenbedingten Schätzung der Körperhaltung, ist unter den top-down Ansätzen auf dem OCHuman-Datensatz das beste. BBox-Mask-Pose erreicht den aktuellen Stand der Technik (SOTA) auf dem OCHuman-Datensatz in allen drei Aufgaben – Detektion, Instanzsegmentierung und Schätzung der Körperhaltung. Es erzielt auch den besten Stand der Technik (SOTA) bei der Schätzung der Körperhaltung im COCO-Datensatz. Die Methode zeichnet sich insbesondere dadurch aus, dass sie in Szenen mit großer Überlappung von Instanzen die Detektion um 39 % gegenüber dem Baseline-Detektor verbessert. Durch kleine spezialisierte Modelle und eine schnellere Laufzeit bietet BMP eine effektive Alternative zu großen menschenzentrierten Grundmodellen. Der Quellcode und die Modelle sind unter https://MiraPurkrabek.github.io/BBox-Mask-Pose verfügbar.请注意,我在翻译中保留了原文中的技术术语,并在必要时添加了英文原文以确保信息完整。同时,我也优化了句子结构,使其更符合德语的表达习惯。希望这能帮助到您!

Erkennung, Pose-Schätzung und Segmentierung für mehrere Körper: Die virtuelle Schleife schließen | Neueste Forschungsarbeiten | HyperAI