6ヶ月前

コンピュータビジョン

ビデオ理解

ディープラーニング

コンピュータビジョン

Peilin Jiang Fei Wang Xuan Wang Zhi Li

概要

3D人体ポーズ推定ネットワークを高精度に訓練するための前提条件は、豊富なラベル付き訓練データの保有である。しかし、手動で豊富かつ正確なラベルを取得することは、不可能ではないにせよ、非常に手間がかかり、時間がかかる。本論文では、単眼動画を活用して、単画像からの3D人体ポーズ推定タスクにおける訓練データセットを補完する手法を提案する。まず、少数のラベル付きデータを用いてベースラインモデルを訓練する。その後、得られたモデルが生成する信頼性の高い推定値を固定し、3D軌道補完問題として解くことで、動画全体にわたる自動ラベル収集を実現する。続いて、収集されたラベルを用いてベースラインモデルを再訓練し、新たなポーズを学習させる。本手法は広く採用されているHuman3.6MおよびMPI-INF-3DHPデータセット上で評価された。実験の結果、わずかな初期ラベルセットのみを前提として、本手法は未ラベルの単眼動画から新たなポーズを学習可能であり、ベースラインモデルの精度を約10%向上させることに成功した。従来の手法と比較して、本手法はマルチビュー画像や明示的な2Dキーポイントラベルに依存しない点が特徴である。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

6ヶ月前

コンピュータビジョン

ビデオ理解

ディープラーニング

コンピュータビジョン

Peilin Jiang Fei Wang Xuan Wang Zhi Li

概要

3D人体ポーズ推定ネットワークを高精度に訓練するための前提条件は、豊富なラベル付き訓練データの保有である。しかし、手動で豊富かつ正確なラベルを取得することは、不可能ではないにせよ、非常に手間がかかり、時間がかかる。本論文では、単眼動画を活用して、単画像からの3D人体ポーズ推定タスクにおける訓練データセットを補完する手法を提案する。まず、少数のラベル付きデータを用いてベースラインモデルを訓練する。その後、得られたモデルが生成する信頼性の高い推定値を固定し、3D軌道補完問題として解くことで、動画全体にわたる自動ラベル収集を実現する。続いて、収集されたラベルを用いてベースラインモデルを再訓練し、新たなポーズを学習させる。本手法は広く採用されているHuman3.6MおよびMPI-INF-3DHPデータセット上で評価された。実験の結果、わずかな初期ラベルセットのみを前提として、本手法は未ラベルの単眼動画から新たなポーズを学習可能であり、ベースラインモデルの精度を約10%向上させることに成功した。従来の手法と比較して、本手法はマルチビュー画像や明示的な2Dキーポイントラベルに依存しない点が特徴である。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています