HyperAIHyperAI
vor 17 Tagen

Human Pose Regression mit residualer Log-Wahrscheinlichkeitsschätzung

Jiefeng Li, Siyuan Bian, Ailing Zeng, Can Wang, Bo Pang, Wentao Liu, Cewu Lu
Human Pose Regression mit residualer Log-Wahrscheinlichkeitsschätzung
Abstract

Wärmekartenbasierte Methoden dominieren im Bereich der menschlichen Pose-Schätzung, indem sie die Ausgabeverteilung durch Wahrscheinlichkeitswärmebilder modellieren. Im Gegensatz dazu sind regressionsbasierte Ansätze effizienter, leiden jedoch unter einer geringeren Leistungsfähigkeit. In dieser Arbeit untersuchen wir die Maximum-Likelihood-Schätzung (MLE), um effiziente und wirksame regressionsbasierte Methoden zu entwickeln. Aus Sicht der MLE entsprechen verschiedene Regressionsverluste unterschiedlichen Annahmen über die Dichtefunktion der Ausgabe. Eine Dichtefunktion, die der wahren Verteilung näherkommt, führt zu einer besseren Regressionsleistung. Ausgehend davon schlagen wir ein neuartiges Regressionsparadigma mit Residual-Log-Wahrscheinlichkeits-Schätzung (RLE) vor, um die zugrundeliegende Ausgabeverteilung präziser zu erfassen. Konkret lernt RLE die Veränderung der Verteilung anstelle der unreferenzierten zugrundeliegenden Verteilung, um den Trainingsprozess zu erleichtern. Durch die vorgeschlagene Umparametrisierung ist unsere Methode mit gängigen Flussmodellen kompatibel. Die vorgeschlagene Methode ist wirksam, effizient und flexibel. Wir zeigen ihre Potenzial in verschiedenen Aufgaben der menschlichen Pose-Schätzung anhand umfassender Experimente. Im Vergleich zum herkömmlichen Regressionsparadigma erzielt die Regression mit RLE eine Verbesserung um 12,4 mAP auf MSCOCO, ohne zusätzlichen Overhead zur Testzeit zu verursachen. Darüber hinaus ist unsere Regressionsmethode erstmals insbesondere bei der Mehrperson-Pose-Schätzung der wärmekartenbasierten Methode überlegen. Unser Code ist unter https://github.com/Jeff-sjtu/res-loglikelihood-regression verfügbar.