7日前

3D人体ポーズ推定におけるクロスデータセット一般化を向上させるためのカメラ視点予測

Zhe Wang, Daeyun Shin, Charless C. Fowlkes
3D人体ポーズ推定におけるクロスデータセット一般化を向上させるためのカメラ視点予測
要約

単眼による3次元人体ポーズ推定は、大規模な真値モーションキャプチャデータセットの可用性に伴い、注目を集めている。しかし、利用可能な訓練データの多様性は限定的であり、モデルが訓練に用いられた特定のデータセットの外にどれだけ一般化できるかは明確でない。本研究では、5つのポーズデータセットを網羅したコンピュータ・コンパニオンにおいて、特定のデータセットに存在する多様性およびバイアスの特性と、それらがクロスデータセット一般化に与える影響について体系的な調査を行う。特に、身体中心座標系に対してカメラの視点分布に見られる体系的な差異に注目する。この観察に基づき、ポーズ推定に加えてカメラの視点を予測する補助タスクを提案する。その結果、ポーズと視点を同時に予測するように学習させたモデルは、クロスデータセット一般化性能が体系的に著しく向上することが明らかになった。