HyperAIHyperAI

Command Palette

Search for a command to run...

複数人姿勢推定と意味的部位セグメンテーションの統合

Fangting Xia; Peng Wang; Xianjie Chen; Alan Yuille

概要

人間の姿勢推定と意味的部位セグメンテーションは、コンピュータビジョンにおける補完的な2つのタスクである。本論文では、自然な多人数画像に対してこれらの2つのタスクを同時に行う方法を提案する。ここで、推定された姿勢が部位セグメントのオブジェクトレベルの形状事前情報を規制し、部位レベルのセグメントが姿勢位置の変動を制約する役割を果たす。具体的には、まず2つの完全畳み込みニューラルネットワーク(FCN)であるPose FCNとPart FCNを訓練して、姿勢関節ポテンシャルと意味的部位ポテンシャルの初期推定を提供する。次に、姿勢関節位置の精度向上のために、これらの2種類のポテンシャルを完全結合条件付き隨機場(Fully-Connected Conditional Random Field, FCRF)で融合する。ここで、新しいセグメント-関節平滑性項が導入され、部位と関節間の意味的および空間的一貫性を促進する。さらに、部位セグメントの精度向上のために、改良された姿勢と元の部位ポテンシャルがPart FCNを通じて統合される。この際、姿勢から得られる骨格特徴が部位セグメントに対する追加的な規制情報として機能する。最後に、FCRFの複雑さを低減するために、人間検出ボックスを導入し、各ボックス内のグラフを推論することで推論速度が40倍速くなるようにした。既存のデータセットには両方のラベル(部位セグメントと姿勢ラベル)が含まれていないため、PASCAL VOC部分データセットに人間の姿勢関節を追加し、最新のいくつかの手法との比較実験を行った。実験結果から、当該データセットにおいて我々のアルゴリズムは両方のタスクで競合手法よりも大幅に優れていることが示された。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています