
要約
2次元人体ポーズ推定において、回帰法よりも直感的であるにもかかわらず、ヒートマップベースの検出手法が主流を占めている。アーキテクチャ的に暗黙的なヒートマップを利用する統合回帰法(integral regression)の導入により、両手法間の違いはさらに縮小された。このことから、検出法が本当に回帰法を上回っているのかという疑問が生じる。本論文では、ヒートマップベースの検出法と統合回帰法の間の主な残存差異である教師信号の違いに着目して検討を行う。その過程で、ソフトマックス関数の後に期待値を取ることに起因する、統合ポーズ回帰における潜在的なバイアスを発見した。このバイアスを補正するため、我々は補正手法を提案し、その効果がすべての2次元ポーズ推定ベンチマークにおいて統合回帰の精度向上に寄与することを確認した。さらに、検出とバイアス補正済み回帰を統合するシンプルなアプローチを提案し、追加要素を最小限に抑えつつ、最先端のベースラインを顕著に上回る性能を達成した。