HyperAIHyperAI

Command Palette

Search for a command to run...

Mixture Density Network を用いた 3D ヒューマンポーズ推定の複数仮説生成

Chen Li Gim Hee Lee

概要

単眼画像または2D関節から3D人間姿勢を推定することは、深度の曖昧さと被遮断された関節のため、不適切に定義された問題です。私たちは、単眼入力からの3D人間姿勢推定が一意の解を持つ逆問題ではなく、複数の可能な解が存在する逆問題であると主張します。本論文では、2D関節から複数の可能な3D姿勢仮説を生成する新しい手法を提案します。既存の深層学習アプローチは、単峰ガウス分布に基づく平均二乗誤差を最小化することに焦点を当てていますが、私たちの方法は多峰混合密度ネットワークに基づいて複数の可能な3D姿勢仮説を生成することができます。実験結果は、2D関節入力から推定した3D姿勢が2D再投影において一貫性を持っていることを示しており、これは2Dから3Dへの逆問題に対して複数の解が存在するとする私たちの主張を支持しています。さらに、Human3.6Mデータセットにおいて最良の仮説と多視点設定で最先端の性能を示し、MPIIおよびMPI-INF-3DHPデータセットでのテストを通じてモデルの汎化能力も証明しました。当該コードはプロジェクトウェブサイトで公開されています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています