Command Palette
Search for a command to run...
畳み込みポーズマシン
畳み込みポーズマシン
Wei Shih-En Ramakrishna Varun Kanade Takeo Sheikh Yaser
概要
Pose Machinesは、豊かな暗黙的な空間モデルを学習するための逐次予測フレームワークを提供する。本研究では、姿勢推定というタスクにおいて、画像特徴および画像依存性空間モデルを学習するために、畳み込みニューラルネットワーク(CNN)をPose Machineフレームワークに統合するための体系的な設計手法を提示する。本論文の貢献は、関節構造を持つ姿勢推定を含む構造化予測タスクにおける変数間の長距離依存関係を暗黙的にモデル化することにある。この目的を達成するために、前段階の信頼度マップを直接処理する畳み込みネットワークから構成される逐次アーキテクチャを設計し、明示的なグラフィカルモデル形式の推論を必要とせずに、部位の位置に関する推定値を段階的に高精度化している。また、学習過程における勾配消失という特有の困難に対処するため、中間層への監視を強制する自然な学習目的関数を提供することで、逆伝播される勾配を補完し、学習プロセスの安定性を向上させている。実験結果により、MPII、LSP、FLICといった標準的なベンチマークにおいて、最先端の性能を達成し、既存の手法を上回ることを示した。