6ヶ月前

畳み込みニューラルネットワーク

コンピュータビジョン

ビデオ理解

アプローチ／フレームワーク

コンピュータビジョン

Bruno Artacho Andreas Savakis

概要

我々は、「ウォーターフォール（Waterfall）」アトラス空間プーリング構造を基盤とする統合型フレームワークであるUniPoseを提案する。本手法は、複数のポーズ推定指標において最先端の性能を達成している。従来のポーズ推定手法は、標準的なCNNアーキテクチャを用いる場合、関節位置の推定において統計的手法や事前に定義されたアンカー・ポーズに大きく依存している。一方、UniPoseは、コンテキストセグメンテーションと関節位置推定を統合的に処理することで、単一段階の推論で高精度な人体ポーズ推定を実現しており、統計的手法に依存しない。UniPoseにおけるウォーターフォールモジュールは、カスケード構造における段階的フィルタリングの効率性を活かしつつ、空間ピラミッド構成と同等のマルチスケールの視野を維持している。さらに、本手法は多フレーム処理に対応するUniPose-LSTMへと拡張され、動画における時間的ポーズ推定においても最先端の成果を達成している。複数のデータセットにおける実験結果から、ResNetをバックボーンとし、ウォーターフォールモジュールを組み合わせたUniPoseは、単一人物のポーズ検出において、単一画像および動画の両方で優れた精度と効率性を兼ね備えた堅牢なアーキテクチャであることが示された。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

6ヶ月前

畳み込みニューラルネットワーク

コンピュータビジョン

ビデオ理解

アプローチ／フレームワーク

コンピュータビジョン

Bruno Artacho Andreas Savakis

概要

我々は、「ウォーターフォール（Waterfall）」アトラス空間プーリング構造を基盤とする統合型フレームワークであるUniPoseを提案する。本手法は、複数のポーズ推定指標において最先端の性能を達成している。従来のポーズ推定手法は、標準的なCNNアーキテクチャを用いる場合、関節位置の推定において統計的手法や事前に定義されたアンカー・ポーズに大きく依存している。一方、UniPoseは、コンテキストセグメンテーションと関節位置推定を統合的に処理することで、単一段階の推論で高精度な人体ポーズ推定を実現しており、統計的手法に依存しない。UniPoseにおけるウォーターフォールモジュールは、カスケード構造における段階的フィルタリングの効率性を活かしつつ、空間ピラミッド構成と同等のマルチスケールの視野を維持している。さらに、本手法は多フレーム処理に対応するUniPose-LSTMへと拡張され、動画における時間的ポーズ推定においても最先端の成果を達成している。複数のデータセットにおける実験結果から、ResNetをバックボーンとし、ウォーターフォールモジュールを組み合わせたUniPoseは、単一人物のポーズ検出において、単一画像および動画の両方で優れた精度と効率性を兼ね備えた堅牢なアーキテクチャであることが示された。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています