HyperAIHyperAI

Command Palette

Search for a command to run...

多人物ポーズ推定のための微分可能な階層的グラフグループ化

Sheng Jin Wentao Liu Enze Xie Wenhai Wang Chen Qian Wanli Ouyang Ping Luo

概要

複数人ポーズ推定は、複数の人物に対して同時に身体のキーポイントを局所化する必要があるため、困難な課題である。従来の手法は、主にトップダウン型とボトムアップ型の2つのアプローチに分けられる。トップダウン型は人物検出をまず行い、その後でキーポイントを局所化するのに対し、ボトムアップ型はキーポイントを直接検出した後、それらを異なる人物ごとにクラスタリング(グループ化)する。ボトムアップ型は一般的にトップダウン型よりも効率的である。しかし、既存のボトムアップ型手法では、キーポイントの検出とクラスタリングの処理が独立して行われるため、エンドツーエンドでの学習が困難であり、最適な性能を発揮できないという課題がある。本論文では、人体部位のグループ化に新たな視点を提示し、これをグラフクラスタリング問題として再定式化する。特に、ボトムアップ型複数人ポーズ推定タスクにおいて、グラフグループ化を学習可能な新しい微分可能Hierarchical Graph Grouping(HGG)手法を提案する。さらに、HGGは主流のボトムアップ型手法に容易に統合可能である。本手法は、人物のキーポイント候補をグラフのノードとして扱い、マルチレイヤーのグラフニューラルネットワークモデルを用いてキーポイントを階層的にクラスタリングする。HGGのモジュールはキーポイント検出ネットワークとエンドツーエンドで学習可能であり、階層的なアプローチでグループ化プロセスを監督することができる。クラスタリングの識別能力を向上させるために、エッジ識別器およびマクロノード識別器を追加している。COCOおよびOCHumanデータセットにおける広範な実験結果から、提案手法がボトムアップ型ポーズ推定手法の性能を顕著に向上させることを示した。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
多人物ポーズ推定のための微分可能な階層的グラフグループ化 | 記事 | HyperAI超神経