12日前

Poseur:Transformerを用いた直接的な人間のポーズ回帰

Weian Mao, Yongtao Ge, Chunhua Shen, Zhi Tian, Xinlong Wang, Zhibin Wang, Anton van den Hengel
Poseur:Transformerを用いた直接的な人間のポーズ回帰
要約

単一画像から2次元人体ポーズ推定を行うための、直接的かつ回帰ベースのアプローチを提案する。本手法では、この問題を系列予測タスクとして定式化し、Transformerネットワークを用いて解く。このネットワークは、ヒートマップなどの中間表現を介さず、画像から関節点の座標へ直接回帰マッピングを学習する。これにより、ヒートマップベースのアプローチに伴う多くの複雑性を回避できる。従来の回帰ベース手法に見られる特徴量の不整合問題を克服するため、ターゲット関節点に最も関連する特徴量に適応的に注目するアテンション機構を提案する。この機構により、精度が顕著に向上する。さらに、本フレームワークはエンドツーエンド微分可能であり、関節点間の依存関係を自然に学習することができる。MS-COCOおよびMPIIという2つの代表的なポーズ推定データセットにおける実験結果から、本手法が回帰ベースのポーズ推定において、従来の最先端技術を大幅に上回ることを示した。特に注目すべきは、本手法が、最も優れたヒートマップベースのポーズ推定手法と比較しても優位性を発揮する、初めての回帰ベースのアプローチである点である。

Poseur:Transformerを用いた直接的な人間のポーズ回帰 | 最新論文 | HyperAI超神経