2ヶ月前
HMOR: ヒエラルキー型多人数順序関係を用いた単眼多人数3D姿勢推定
Li, Jiefeng ; Wang, Can ; Liu, Wentao ; Qian, Chen ; Lu, Cewu

要約
単眼RGBカメラからの3次元ヒューマンポーズ推定において、著しい進展が見られています。しかし、3次元多人数のケースを扱った研究はまだ少数にとどまっています。本論文では、トップダウンアプローチにおける全体的な視点の不足を解決するために、新しい形式の教師あり学習である階層的多人数順序関係(Hierarchical Multi-person Ordinal Relations: HMOR)を導入します。HMORは深さと角度の順序関係を階層的に符号化し、身体部位レベルおよび関節レベルの意味情報を捉えつつ、同時に全体の一貫性を維持します。当方針では、これらの順序関係を学習過程で活用する統合型トップダウンモデルが設計されています。統合モデルは、人間のバウンディングボックス、人間の深さ、およびルート相対的な3次元ポーズを同時に推定し、粗いものから細かいものへのアーキテクチャにより深さ推定の精度向上を目指しています。提案手法は公開されている多人数3次元ポーズデータセットにおいて現行最先端手法を大幅に上回る性能を示しており、優れた性能だけでなく計算複雑度が低くモデルパラメータも少ないという利点があります。