13日前
HEMlets Pose:正確な3D人体ポーズ推定のためのパーツ中心型ヒートマップトリプレット学習
Kun Zhou, Xiaoguang Han, Nianjuan Jiang, Kui Jia, Jiangbo Lu

要約
単一の画像から3次元人体ポーズを推定することは、困難な課題である。本研究では、検出された2次元関節を3次元空間に「持ち上げる(lifting)」際の不確実性を軽減するため、中間状態として「部位中心ヒートマップトリプレット(Part-Centric Heatmap Triplets, HEMlets)」を導入した。これにより、2次元観測と3次元解釈の間のギャップを短縮する。HEMletsは、各骨格部位の端関節間の相対的な奥行情報を表現するために、3つの関節ヒートマップを用いる。本手法では、まず入力画像からHEMletsを予測する畳み込みネットワーク(ConvNet)を学習し、その後、体積的関節ヒートマップの回帰を実行する。体積的ヒートマップから関節位置を抽出する際には積分演算を活用することで、エンドツーエンドの学習を保証している。ネットワーク構成は単純であるにもかかわらず、定量的な比較において、最良の既存手法(Human3.6Mデータセット上で20%の向上)を顕著に上回る性能を示した。提案手法は、僅かにアノテーションされた関節の相対的奥行情報しか得られない「ワイルド(in-the-wild)」画像を用いた学習を自然にサポートするため、屋外画像における定性的な比較を通じて、モデルの汎化能力がさらに向上していることが確認された。