2ヶ月前
MetaPose: 複数視点からの高速3Dポーズ推定に3D教師なしで
Ben Usman; Andrea Tagliasacchi; Kate Saenko; Avneesh Sud

要約
深層学習の時代において、未知のキャリブレーションを持つ複数カメラからのヒューマンポーズ推定はこれまであまり注目されていませんでした。本研究では、このタスクを高精度かつ最小限の遅延オーバーヘッドで行う神経モデルの訓練方法を示します。提案されたモデルは、複数視点からの遮蔽により生じる関節位置の不確実性を考慮し、訓練に2Dキーポイントデータのみを使用します。我々の手法は、既存の人間動作推定データセットであるHuman3.6Mにおいて、古典的な束調整法と弱教師付き単眼3Dベースラインを上回る性能を示しました。さらに、より困難な野外環境でのSki-Pose PTZデータセットでも優れた結果を達成しています。