17日前

15キーポイントだけで十分です

Michael Snower, Asim Kadav, Farley Lai, Hans Peter Graf
15キーポイントだけで十分です
要約

ポーズトラッキングは、動画の異なるフレーム間で個々の人体ポーズインスタンスを識別し、時間的に一致させるという重要な課題である。しかし、従来のポーズトラッキング手法は、時間的関係を正確にモデル化できず、計算量が大きく、多くの場合オフラインでトラッキングを実行する必要がある。本研究では、RGB情報やオプティカルフローを一切使用せずに、キーポイント情報のみに依存する効率的な多人数ポーズトラッキング手法、KeyTrackを提案する。本手法では、Pose Entailmentと呼ばれる新しいアプローチによりキーポイントをリアルタイムで追跡する。具体的には、動画内の異なるフレームからペアのポーズ推定値をサンプリングし、それらをトークン化する。その後、Transformerベースのネットワークが、一方のポーズが他方のポーズに時間的に続くか否かを二値分類する。さらに、Pose Entailmentステップで使用されるキーポイント推定の精度を向上させるために、パラメータフリーな新規キーポイント精査技術をトップダウン型ポーズ推定手法に組み込む。このアプローチにより、PoseTrack'17およびPoseTrack'18のベンチマークにおいて、他のほとんどの手法に比べて極めて少ない計算量で最先端の性能を達成した。

15キーポイントだけで十分です | 最新論文 | HyperAI超神経