17日前
3次元手のポーズ推定における効率的な仮想ビュー選択
Jian Cheng, Yanguang Wan, Dexin Zuo, Cuixia Ma, Jian Gu, Ping Tan, Hongan Wang, Xiaoming Deng, Yinda Zhang

要約
単一深度画像からの3次元手のポーズ推定は、コンピュータビジョンにおける基本的な課題であり、広範な応用が期待されている。しかし、手の姿勢の視点変化や自己遮蔽(occlusion)の影響により、従来の手法は満足のいく推定結果を達成できていない。本論文では、単一深度画像からの3次元手のポーズ推定を対象に、新たな仮想視点選択および融合モジュールを提案する。本手法では、ポーズ推定に適した複数の仮想視点を自動的に選択し、それらの推定結果を統合するアプローチを採用する。実証的に、このアプローチが高精度かつロバストなポーズ推定を実現できることを示した。仮想視点の選択において、効果的な視点を効率的に特定するため、軽量ネットワークを用いてネットワーク蒸留(network distillation)により仮想視点の信頼度を評価する手法を導入した。NYU、ICVL、Hands2019の3つの主要ベンチマークデータセットにおける実験結果から、本手法はNYUおよびICVLにおいて最先端手法を上回り、Hands2019-Task1においても非常に競争力のある性能を達成した。さらに、提案する仮想視点選択および融合モジュールが3次元手のポーズ推定において有効であることが確認された。