6ヶ月前

概要

複数カメラセットアップからの3次元人体ポーズ推定を目的とした新規手法を提案する。本手法は、分散型スマートエッジセンサと、セマンティックフィードバックループを通じて接続されたバックエンドを組み合わせる。各カメラ視点における2次元関節検出は、専用の組み込み推論プロセッサ上でローカルに実行される。ネットワークを介して送信されるのはセマンティックなスケルトン表現のみであり、生の画像データはセンサ基板上に留保される。3次元ポーズは、中央のバックエンドで2次元関節点から三角測量と、人体スケルトンに関する事前知識を組み込んだボディモデルに基づいて復元される。バックエンドから個々のセンサへのフィードバックチャネルは、セマンティックレベルで実装されている。エコントリック（外在的）な3次元ポーズは、センサ視点に逆投影され、2次元関節検出結果と融合される。これにより、各センサ上のローカルセマンティックモデルは、グローバルな文脈情報を取り入れることで向上する。全体のパイプラインはリアルタイム処理が可能である。本手法は3つの公的データセット上で評価され、最先端の性能を達成し、フィードバックアーキテクチャの有効性を示した。また、複数人を対象とした自前の実験環境でも有効性を検証した。フィードバック信号の利用により、2次元関節検出の精度が向上し、その結果、推定された3次元ポーズの品質も改善された。

ソースPDF