HyperAIHyperAI

Command Palette

Search for a command to run...

注目領域の中心:マルチペルソンポーズ推定のためのアテンションを用いたセンター・キーポイントグループ化

Guillem Brasó Nikita Kister Laura Leal-Taixé

概要

本稿では、画像内の識別子に依存しないキーポイントと人物中心位置の予測をもとに、人間のポーズを推定するアテンションベースのフレームワーク「CenterGroup」を提案する。本手法は、検出されたすべてのキーポイントおよび中心位置に対してコンテキストに応じた埋め込み表現を取得するためにTransformerを用い、その後、マルチヘッドアテンションを用いてキーポイントを直接対応する人物中心にグループ化する。従来のボトムアップ手法は推論時に学習不能なクラスタリング手法に依存しているが、CenterGroupはキーポイント検出器と同時にエンドツーエンドで学習可能な完全微分可能なアテンション機構を採用している。その結果、競合するボトムアップ手法と比較して最大2.5倍高速な推論速度を達成しつつ、最先端の性能を実現した。本研究のコードは、https://github.com/dvl-tum/center-group にて公開されている。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています