
要約
画像中の複数の人物の2D姿勢を効率的に検出する手法を提案します。本手法では、パーザ間アフィニティフィールド(Part Affinity Fields, PAFs)と呼ぶ非パラメトリック表現を使用し、画像内の各個人の身体部位を学習して関連付ける方法を開発しました。このアーキテクチャは全体的なコンテキストをエンコードしており、人数に関わらず高精度を維持しながらリアルタイム性能を達成するための貪欲なボトムアップ解析ステップが可能となっています。アーキテクチャは、同一の逐次予測プロセスの2つのブランチを通じて、部位位置とその関連付けを共同で学習することを目指して設計されています。当手法はCOCO 2016キーポイントチャレンジで第1位となり、MPIIマルチパーソンベンチマークにおいても性能と効率性の両面で従来の最先端結果を大幅に上回っています。