Der Teufel steckt im Detail: Ein tieferer Einblick in die verfälschungsfreie Datenverarbeitung für die menschliche Pose-Schätzung

Als fundamentaler Bestandteil von Training und Inferenz wurde die Datenverarbeitung in der Gemeinschaft der menschlichen Pose-Schätzung, soweit uns bekannt ist, bisher nicht systematisch betrachtet. In diesem Artikel konzentrieren wir uns auf dieses Problem und stellen fest, dass der Kern der Herausforderung bei der Entwicklung der menschlichen Pose-Schätzung in einer verzerrten Datenverarbeitung liegt. Genauer untersucht, dass die gängigen Datenverarbeitungsschritte in modernen Ansätzen – insbesondere die Koordinatensystemtransformation und die Schlüsselpunkt-Format-Transformation (d.h. Kodierung und Dekodierung) – dazu führen, dass die Ergebnisse der üblichen Spiegelstrategie bei der Inferenz nicht mehr mit den ursprünglichen Ergebnissen übereinstimmen. Darüber hinaus weisen einige Methoden zur Schlüsselpunkt-Format-Transformation einen statistischen Fehler auf. Diese beiden Probleme treten zusammen auf und verschlechtern die Leistung der Pose-Schätzung erheblich, wodurch eine Falle für die Forschungsgemeinschaft entsteht. Diese Falle hat zahlreiche suboptimale Abhilfemaßnahmen hervorgebracht, die stets unberichtet bleiben, verwirrend aber dennoch stark beeinflussend sind. Durch die Verhinderung einer reproduzierbaren Evaluation und die Schaffung unfairen Vergleichs behindern diese unberichteten Maßnahmen die technologische Entwicklung erheblich. Um dieses Dilemma an der Quelle zu lösen, schlagen wir Unbiased Data Processing (UDP) vor, eine Methode, die zwei technische Ansätze umfasst, um jeweils die oben genannten Probleme zu adressieren (nämlich eine verzerrungsfreie Koordinatensystemtransformation und eine verzerrungsfreie Schlüsselpunkt-Format-Transformation). Als modellunabhängige und überlegene Lösung gelingt es UDP, die Leistungsgrenze der menschlichen Pose-Schätzung erheblich zu überschreiten und der Forschungsgemeinschaft eine höhere und zuverlässigere Basis für zukünftige Arbeiten zu bieten. Der Quellcode ist öffentlich verfügbar unter: https://github.com/HuangJunJie2017/UDP-Pose