17日前
TFPose:Transformerを用いた直接的な人体ポーズ推定
Weian Mao, Yongtao Ge, Chunhua Shen, Zhi Tian, Xinlong Wang, Zhibin Wang

要約
本研究では、回帰アプローチに基づく人体ポーズ推定フレームワークを提案する。従来の回帰ベース手法とは異なり、これらの手法はしばしば最先端の手法に比べて性能が劣っていたが、本研究ではポーズ推定問題を系列予測問題として定式化し、Transformerによって効果的に解決可能とする。提案手法はシンプルかつ直感的であり、ヒートマップベースのポーズ推定における欠点を回避する。さらに、Transformerに組み込まれたアテンション機構により、ターゲットキーポイントに最も関連する特徴量に適応的に注目できるため、従来の回帰ベース手法に見られる特徴の不一致問題を大幅に克服し、性能を著しく向上させている。特に重要な点として、本フレームワークはキーポイント間の構造的関係を本質的に活用できる。MS-COCOおよびMPIIデータセットにおける実験結果から、本手法が回帰ベースのポーズ推定において最先端の性能を著しく向上させ、最も優れたヒートマップベースの手法と同等の性能を達成できることを示した。