6ヶ月前

コンピュータビジョン

マルチタスク学習

ディープラーニング

アプローチ／フレームワーク

コンピュータビジョン

Yu Rong Takaaki Shiratori Hanbyul Joo

概要

現在の主流である単眼3次元ポーズ推定手法は、通常、人体の一部（たとえば体幹や四肢）にのみ注目しており、人間の運動の本質的なニュアンスが顔、手、体の各部位における微細な連携運動によって伝達されることを無視している。本論文では、野生環境下の単眼画像から顔、手、体の3次元ポーズを同時に高精度かつ高速に推定できる「FrankMocap」という全体人体3次元ポーズ推定システムを提案する。FrankMocapの核となるアイデアは、モジュール型設計である。まず、顔、手、体それぞれに対して独立して3次元ポーズ回帰手法を適用し、その後、統合モジュールを用いて各回帰出力を統合する。独立した回帰モジュールにより、各部位の最先端の性能を最大限に活かしつつ、実用上における元の精度と信頼性を損なわずに運用可能となる。本研究では、遅延と精度のトレードオフを考慮した3種類の統合モジュールを構築した。これらはいずれも、独立した出力を滑らかに統合し、一貫した全体人体ポーズ推定結果を効果的に得るシンプルかつ実用的な解決策を提供する。定量的および定性的な実験により、本手法が、最適化ベースおよびエンドツーエンド型の全体人体ポーズ推定手法を上回ることを示した。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

6ヶ月前

コンピュータビジョン

マルチタスク学習

ディープラーニング

アプローチ／フレームワーク

コンピュータビジョン

Yu Rong Takaaki Shiratori Hanbyul Joo

概要

現在の主流である単眼3次元ポーズ推定手法は、通常、人体の一部（たとえば体幹や四肢）にのみ注目しており、人間の運動の本質的なニュアンスが顔、手、体の各部位における微細な連携運動によって伝達されることを無視している。本論文では、野生環境下の単眼画像から顔、手、体の3次元ポーズを同時に高精度かつ高速に推定できる「FrankMocap」という全体人体3次元ポーズ推定システムを提案する。FrankMocapの核となるアイデアは、モジュール型設計である。まず、顔、手、体それぞれに対して独立して3次元ポーズ回帰手法を適用し、その後、統合モジュールを用いて各回帰出力を統合する。独立した回帰モジュールにより、各部位の最先端の性能を最大限に活かしつつ、実用上における元の精度と信頼性を損なわずに運用可能となる。本研究では、遅延と精度のトレードオフを考慮した3種類の統合モジュールを構築した。これらはいずれも、独立した出力を滑らかに統合し、一貫した全体人体ポーズ推定結果を効果的に得るシンプルかつ実用的な解決策を提供する。定量的および定性的な実験により、本手法が、最適化ベースおよびエンドツーエンド型の全体人体ポーズ推定手法を上回ることを示した。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています