HyperAIHyperAI

Command Palette

Search for a command to run...

効率的な手のメッシュ再構築のためのシンプルなベースライン

Zhishan Zhou* Shihao Zhou* Zhi Lv Minqiang Zou Yao Tang Jiajun Liang †

概要

3次元手の姿勢推定は、ジェスチャ認識や人間と機械の相互作用などの分野で広範な応用が見られています。性能向上に伴い、システムの複雑さも増しており、これがこれらの手法の比較分析や実践的な適用を制限する要因となっています。本論文では、最新の手法(State-of-the-Art: SOTA)を上回り、かつ計算効率性を示す単純ながら効果的なベースラインを提案します。このベースラインを確立するために、既存の研究をトークン生成器とメッシュ回帰器という2つの構成要素に抽象化し、それらの核心構造を検討しました。ここでいう核心構造とは、内在的な機能を満たし、大幅な改善をもたらし、不要な複雑さなく優れた性能を達成するものです。我々が提案するアプローチはバックボーンへの変更から独立しており、現代のあらゆるモデルに適応可能です。我々の方法は既存の解決策を超えており、複数のデータセットにおいて最新(SOTA)の結果を得ています。FreiHANDデータセットでは、PA-MPJPEが5.7mm、PA-MPVPEが6.0mmという結果を出しています。同様にDexycbデータセットでも、PA-MPJPEが5.5mm、PA-MPVPEが5.0mmという結果を得ました。性能速度については、HRNetを使用した場合最大33フレーム毎秒(fps)、FastViT-MA36を使用した場合は最大70fpsに達しています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています