11日前

マルチビュー画像を用いたグラフベースの3D多人数ポーズ推定

Size Wu, Sheng Jin, Wentao Liu, Lei Bai, Chen Qian, Dong Liu, Wanli Ouyang
マルチビュー画像を用いたグラフベースの3D多人数ポーズ推定
要約

本稿では、複数の校正済みカメラビューから複数人の3次元人体ポーズを推定するタスクについて検討する。トップダウンアプローチに従い、このタスクを2段階に分解する:人物の局所化とポーズ推定。両段階とも、粗いものから細かいものへと段階的に処理する。さらに、効果的なメッセージ伝達を実現するため、3種類のタスク特化型グラフニューラルネットワークを提案する。3次元人物局所化のためには、まずマルチビュー・マッチング・グラフモジュール(MMG)を用いて視点間の関連性を学習し、粗い人体候補を復元する。その後、センター精緻化グラフモジュール(CRG)により、柔軟な点ベースの予測によって結果をさらに精緻化する。3次元ポーズ推定では、ポーズ回帰グラフモジュール(PRG)が、複数ビュー間の幾何構造および人体関節間の構造的関係を同時に学習する。本手法は、CMU PanopticおよびShelfデータセットにおいて、従来の最先端手法と同等以上の性能を達成しつつ、著しく低い計算複雑性を実現した。

マルチビュー画像を用いたグラフベースの3D多人数ポーズ推定 | 最新論文 | HyperAI超神経