7日前

多人物ポーズ推定のための微分可能な階層的グラフグループ化

Sheng Jin, Wentao Liu, Enze Xie, Wenhai Wang, Chen Qian, Wanli Ouyang, Ping Luo
多人物ポーズ推定のための微分可能な階層的グラフグループ化
要約

複数人ポーズ推定は、複数の人物に対して同時に身体のキーポイントを局所化する必要があるため、困難な課題である。従来の手法は、主にトップダウン型とボトムアップ型の2つのアプローチに分けられる。トップダウン型は人物検出をまず行い、その後でキーポイントを局所化するのに対し、ボトムアップ型はキーポイントを直接検出した後、それらを異なる人物ごとにクラスタリング(グループ化)する。ボトムアップ型は一般的にトップダウン型よりも効率的である。しかし、既存のボトムアップ型手法では、キーポイントの検出とクラスタリングの処理が独立して行われるため、エンドツーエンドでの学習が困難であり、最適な性能を発揮できないという課題がある。本論文では、人体部位のグループ化に新たな視点を提示し、これをグラフクラスタリング問題として再定式化する。特に、ボトムアップ型複数人ポーズ推定タスクにおいて、グラフグループ化を学習可能な新しい微分可能Hierarchical Graph Grouping(HGG)手法を提案する。さらに、HGGは主流のボトムアップ型手法に容易に統合可能である。本手法は、人物のキーポイント候補をグラフのノードとして扱い、マルチレイヤーのグラフニューラルネットワークモデルを用いてキーポイントを階層的にクラスタリングする。HGGのモジュールはキーポイント検出ネットワークとエンドツーエンドで学習可能であり、階層的なアプローチでグループ化プロセスを監督することができる。クラスタリングの識別能力を向上させるために、エッジ識別器およびマクロノード識別器を追加している。COCOおよびOCHumanデータセットにおける広範な実験結果から、提案手法がボトムアップ型ポーズ推定手法の性能を顕著に向上させることを示した。

多人物ポーズ推定のための微分可能な階層的グラフグループ化 | 最新論文 | HyperAI超神経