8ヶ月前

コンピュータビジョン

ビデオ処理

コンピュータビジョン

Yun-Chun Chen Marco Piccirilli Robinson Piramuthu Ming-Hsuan Yang

概要

ビデオから3次元の人間の姿勢と形状を推定するタスクについて考察します。既存のフレームベースの手法は著しい進歩を遂げていますが、これらの方法は各画像に対して独立して適用されるため、しばしば一貫性のない予測を導くことがあります。本研究では、3次元の人間の姿勢と形状推定に向けたビデオベースの学習アルゴリズムを提案します。当手法の重要な洞察は以下の2点です。第一に、時間的な予測の一貫性問題に対処するために、ビデオ内の時間情報を活用し、短距離および長距離のフレーム間依存関係を総合的に考慮する自己注意モジュールを提案します。これにより、時間的に一貫した推定結果が得られます。第二に、人間の動きをモデル化するために、隣接するフレーム間での滑らかな遷移を可能にする予測モジュールを使用します。当手法を3DPW、MPI-INF-3DHP、およびHuman3.6Mデータセットで評価しました。広範な実験結果は、当アルゴリズムが最先端の手法に対して有利に機能することを示しています。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

8ヶ月前

コンピュータビジョン

ビデオ処理

コンピュータビジョン

Yun-Chun Chen Marco Piccirilli Robinson Piramuthu Ming-Hsuan Yang

概要

ビデオから3次元の人間の姿勢と形状を推定するタスクについて考察します。既存のフレームベースの手法は著しい進歩を遂げていますが、これらの方法は各画像に対して独立して適用されるため、しばしば一貫性のない予測を導くことがあります。本研究では、3次元の人間の姿勢と形状推定に向けたビデオベースの学習アルゴリズムを提案します。当手法の重要な洞察は以下の2点です。第一に、時間的な予測の一貫性問題に対処するために、ビデオ内の時間情報を活用し、短距離および長距離のフレーム間依存関係を総合的に考慮する自己注意モジュールを提案します。これにより、時間的に一貫した推定結果が得られます。第二に、人間の動きをモデル化するために、隣接するフレーム間での滑らかな遷移を可能にする予測モジュールを使用します。当手法を3DPW、MPI-INF-3DHP、およびHuman3.6Mデータセットで評価しました。広範な実験結果は、当アルゴリズムが最先端の手法に対して有利に機能することを示しています。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

ビデオからの自己注意3次元人間の姿勢と形状推定 | 記事 | HyperAI超神経