HyperAIHyperAI
vor 17 Tagen

AID: Das Leistungslimit der menschlichen Pose-Schätzung durch Informations-Verlust-Augmentierung vorantreiben

Junjie Huang, Zheng Zhu, Guan Huang, Dalong Du
AID: Das Leistungslimit der menschlichen Pose-Schätzung durch Informations-Verlust-Augmentierung vorantreiben
Abstract

Sowohl visuelle Hinweise (appearance cues) als auch strukturelle Einschränkungen (constraint cues) sind entscheidend für die menschliche Pose-Schätzung. In den meisten bestehenden Ansätzen besteht jedoch die Tendenz, sich übermäßig auf die ersteren zu konzentrieren und die letzteren zu vernachlässigen. In dieser Arbeit stellen wir Augmentation by Information Dropping (AID) vor, um dieses Dilemma zu verifizieren und zu lösen. Als Voraussetzung zur effektiven Nutzung des Potenzials von AID entwickeln wir maßgeschneiderte Trainingsstrategien, die auf einer Analyse des Verlaufs von Verlustfunktion und Leistung während des Trainingsprozesses basieren, unter dem Aspekt der Informationsversorgung. In Experimenten zeigt AID, als eine modellunabhängige Methode, eine konsistente Verbesserung verschiedener State-of-the-Art-Methoden in sowohl bottom-up- als auch top-down-Paradigmen, unabhängig von Eingabegröße, Architektur, Backbone-Modellen sowie Trainings- und Testdatensätzen. Auf dem etablierten COCO-Datensatz für menschliche Pose-Schätzung steigert AID die Leistung unterschiedlicher Konfigurationen um etwa 0,6 AP im top-down-Paradigma und bis zu 1,5 AP im bottom-up-Paradigma. Auf dem anspruchsvolleren CrowdPose-Datensatz liegt die Verbesserung sogar über 1,5 AP. Da AID die Leistungsgrenze der menschlichen Pose-Schätzung signifikant überschreitet und eine neue State-of-the-Art-Performance erreicht, hoffen wir, dass AID künftig als Standardkonfiguration beim Training von Pose-Schätzern etabliert wird. Der Quellcode wird für zukünftige Forschungsarbeiten öffentlich verfügbar gemacht.