17日前

注目領域の中心:マルチペルソンポーズ推定のためのアテンションを用いたセンター・キーポイントグループ化

Guillem Brasó, Nikita Kister, Laura Leal-Taixé
注目領域の中心:マルチペルソンポーズ推定のためのアテンションを用いたセンター・キーポイントグループ化
要約

本稿では、画像内の識別子に依存しないキーポイントと人物中心位置の予測をもとに、人間のポーズを推定するアテンションベースのフレームワーク「CenterGroup」を提案する。本手法は、検出されたすべてのキーポイントおよび中心位置に対してコンテキストに応じた埋め込み表現を取得するためにTransformerを用い、その後、マルチヘッドアテンションを用いてキーポイントを直接対応する人物中心にグループ化する。従来のボトムアップ手法は推論時に学習不能なクラスタリング手法に依存しているが、CenterGroupはキーポイント検出器と同時にエンドツーエンドで学習可能な完全微分可能なアテンション機構を採用している。その結果、競合するボトムアップ手法と比較して最大2.5倍高速な推論速度を達成しつつ、最先端の性能を実現した。本研究のコードは、https://github.com/dvl-tum/center-group にて公開されている。

注目領域の中心:マルチペルソンポーズ推定のためのアテンションを用いたセンター・キーポイントグループ化 | 最新論文 | HyperAI超神経