11日前
混雑したシーンにおけるマルチビュー幾何学を用いた多人数3Dポーズ推定
He Chen, Pengfei Guo, Pengfei Li, Gim Hee Lee, Gregory Chirikjian

要約
現在の多人数・多カメラ3次元人体ポーズ推定手法において、エピポーラ制約は特徴点のマッチングおよび深度推定の根幹を成している。この定式化は、比較的疎な群衆シーンでは良好な性能を発揮するが、密な群衆環境下では主に二つの要因による曖昧さのため、その有効性が頻繁に損なわれる。第一の要因は、関節間のユークリッド距離とエピポーラ線に基づく単純な特徴量による関節の誤マッチングである。第二の要因は、問題を単純な最小二乗誤差最小化として定式化したことによるロバスト性の欠如である。本論文では、従来の多人数3次元ポーズ推定の定式化から離れて、代わりに「群衆ポーズ推定」という新たな枠組みを提案する。本手法は、二つの主要な構成要素からなる:視点間高速マッチングを実現するグラフモデル、および3次元人体ポーズ再構成に用いる事後確率最大化(MAP)推定器。本手法の有効性と優位性を、4つのベンチマークデータセット上で実証した。