6ヶ月前

コンピュータビジョン

ビデオ理解

オブジェクト追跡

コンピュータビジョン

Xinwei Yu Xiaohua Zhang

概要

現在の3D人体ポーズ推定タスクにおいて、多くの手法は空間的・時間的相関から2D-3D投影の規則を学習する。しかし、従来の手法は時間領域における全身関節のグローバルな特徴をモデル化する一方で、個々の関節の運動軌道を無視している。最近の研究[29]では、異なる関節間で運動に差異が生じることに着目し、各関節の時間的関係を個別に処理している。しかし、我々は特定の動作において異なる関節が同じ運動傾向を示すことを発見した。このため、本研究で提案するFusionformer手法は、空間時間モジュールに基づき、自己軌道モジュールと相互軌道モジュールを導入した。その後、線形ネットワークを用いて、グローバルな空間時間特徴とローカルな関節軌道特徴を並列的に融合する。また、不良な2Dポーズが3D投影に与える影響を低減するため、最終的にポーズ精細化ネットワークを導入し、3D投影の整合性をバランスさせる。さらに、本手法は2つのベンチマークデータセット（Human3.6M、MPI-INF-3DHP）上で評価された。ベースライン手法であるPoseFormerと比較した結果、Human3.6Mデータセットにおいて、MPJPEが2.4%、P-MPJPEが4.3%改善した。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

6ヶ月前

コンピュータビジョン

ビデオ理解

オブジェクト追跡

コンピュータビジョン

Xinwei Yu Xiaohua Zhang

概要

現在の3D人体ポーズ推定タスクにおいて、多くの手法は空間的・時間的相関から2D-3D投影の規則を学習する。しかし、従来の手法は時間領域における全身関節のグローバルな特徴をモデル化する一方で、個々の関節の運動軌道を無視している。最近の研究[29]では、異なる関節間で運動に差異が生じることに着目し、各関節の時間的関係を個別に処理している。しかし、我々は特定の動作において異なる関節が同じ運動傾向を示すことを発見した。このため、本研究で提案するFusionformer手法は、空間時間モジュールに基づき、自己軌道モジュールと相互軌道モジュールを導入した。その後、線形ネットワークを用いて、グローバルな空間時間特徴とローカルな関節軌道特徴を並列的に融合する。また、不良な2Dポーズが3D投影に与える影響を低減するため、最終的にポーズ精細化ネットワークを導入し、3D投影の整合性をバランスさせる。さらに、本手法は2つのベンチマークデータセット（Human3.6M、MPI-INF-3DHP）上で評価された。ベースライン手法であるPoseFormerと比較した結果、Human3.6Mデータセットにおいて、MPJPEが2.4%、P-MPJPEが4.3%改善した。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

(Fusionformer): Transformerを基盤とする統合ネットワークを用いた3D人体ポーズ推定における連合運動シンエジーの活用 | 記事 | HyperAI超神経