1ヶ月前

人間姿勢推定のための深層高解像度表現学習

Ke Sun; Bin Xiao; Dong Liu; Jingdong Wang
人間姿勢推定のための深層高解像度表現学習
要約

これは、Deep High-Resolution Representation Learning for Human Pose Estimation の公式 PyTorch 実装です。本研究では、信頼性の高い高解像度表現を学習することに焦点を当てた人間の姿勢推定問題に興味を持っています。既存の多くの手法は、高解像度から低解像度へ変換するネットワークによって生成された低解像度表現から高解像度表現を復元しています。これに対して、我々が提案するネットワークは全体のプロセスを通じて高解像度表現を維持します。まず、最初のステージとして高解像度サブネットワークから始め、徐々に高解像度から低解像度へのサブネットワークを追加してより多くのステージを形成し、複数の解像度サブネットワークを並列に接続します。繰り返し多尺度融合を行いますので、各高解像度から低解像度への表現は他の並列表現から情報を何度も受け取り、豊かな高解像度表現が得られます。その結果、予測されるキーポイントヒートマップは潜在的により正確で空間的にもより精密になります。我々は実験的に COCO キーポイント検出データセットと MPII 人間姿勢データセットという2つのベンチマークデータセットでの優れた姿勢推定結果を通じて、提案したネットワークの有効性を示しています。コードとモデルは \url{https://github.com/leoxiaobin/deep-high-resolution-net.pytorch} で公開されています。

人間姿勢推定のための深層高解像度表現学習 | 最新論文 | HyperAI超神経