要約
単眼画像から3次元姿勢を推定する問題に取り組む。しかし、画像特徴量から完全な姿勢へと回帰するのではなく、関節の3次元空間内での位置を回帰し、3次元絵画構造(3D pictorial structure)フレームワークを用いて姿勢を推論する。回帰には、画像から2次元姿勢や深度データから3次元姿勢を効率的に予測できることが示されている回帰森(regression forests)を用いる。しかし、これらの手法は直接適用できない。なぜなら、各局所的な画像または深度特徴量は、特徴量の位置からの関節間の相対位置を推定するのみであり、特徴量と関節の位置が2次元または3次元空間で与えられている場合にのみ相対位置が明確に定義されるからである。一方、深度情報のない2次元画像から特徴量をサンプリングし、関節位置を3次元世界座標系で予測する場合には、相対位置は定義されない。