2ヶ月前

HigherHRNet: スケール認識型表現学習を用いたボトムアップの人間姿勢推定

Bowen Cheng; Bin Xiao; Jingdong Wang; Honghui Shi; Thomas S. Huang; Lei Zhang
HigherHRNet: スケール認識型表現学習を用いたボトムアップの人間姿勢推定
要約

底アップの人間姿勢推定手法は、スケール変動の課題により小さな人物の正しい姿勢を予測することが困難である。本論文では、高解像度特徴ピラミッドを使用してスケールに応じた表現を学習する新しい底アップの人間姿勢推定手法、HigherHRNetを提案する。訓練には多解像度監督、推論には多解像度集約を装備しており、提案手法は底アップ多人物姿勢推定におけるスケール変動の課題を解決し、特に小さな人物のキーポイントをより正確に局在化できる。HigherHRNetの特徴ピラミッドは、HRNetからの特徴マップ出力と転置畳み込みを通じて得られる上サンプリングされた高解像度出力を組み合わせている。COCO test-devにおいて、中規模人物に対するAP(平均精度)で2.5%向上し、スケール変動への対処能力を示している。さらに、精緻化やその他の後処理技術を使用せずにCOCO test-devで新規最良結果(70.5% AP)を達成し、既存のすべての底アップ手法を上回っている。またCrowdPose testでは67.6% APでトップダウン手法全てを凌駕しており、混雑したシーンでの堅牢性が示されている。コードとモデルはhttps://github.com/HRNet/Higher-HRNet-Human-Pose-Estimation から入手可能である。