2ヶ月前

畳み込みポーズマシン

Wei, Shih-En ; Ramakrishna, Varun ; Kanade, Takeo ; Sheikh, Yaser
畳み込みポーズマシン
要約

ポーズマシンは、豊かな暗黙的な空間モデルを学習するための逐次予測フレームワークを提供します。本研究では、畳み込みネットワークをポーズマシンフレームワークに組み込むための体系的な設計方法について示し、画像特徴量と画像依存の空間モデルを学習してポーズ推定タスクを行う方法を提案します。本論文の貢献点は、構造化予測タスク(例えば関節付きポーズ推定)において変数間の長距離依存関係を暗黙的にモデル化することです。これを達成するために、前段階からの信頼マップに対して直接作用する畳み込みネットワークからなる逐次アーキテクチャを設計しました。これにより、部分位置のより洗練された推定が可能となり、明示的なグラフィカルモデル風の推論を必要とせずに精度が向上します。当手法は、訓練時の勾配消失問題に対処するために、中間監督を強制する自然な学習目的関数を提供することで、逆伝播される勾配を補充し、学習手続きを条件付けます。我々は標準的なベンチマークデータセット(MPII, LSP, およびFLICデータセット)において最先端の性能を示し、競合する手法よりも優れた結果を得ました。

畳み込みポーズマシン | 最新論文 | HyperAI超神経