2ヶ月前

効率的な手のメッシュ再構築のためのシンプルなベースライン

Zhou, Zhishan ; zhou, Shihao. ; Lv, Zhi ; Zou, Minqiang ; Tang, Yao ; Liang, Jiajun
効率的な手のメッシュ再構築のためのシンプルなベースライン
要約

3次元手の姿勢推定は、ジェスチャ認識や人間と機械の相互作用などの分野で広範な応用が見られています。性能向上に伴い、システムの複雑さも増しており、これがこれらの手法の比較分析や実践的な適用を制限する要因となっています。本論文では、最新の手法(State-of-the-Art: SOTA)を上回り、かつ計算効率性を示す単純ながら効果的なベースラインを提案します。このベースラインを確立するために、既存の研究をトークン生成器とメッシュ回帰器という2つの構成要素に抽象化し、それらの核心構造を検討しました。ここでいう核心構造とは、内在的な機能を満たし、大幅な改善をもたらし、不要な複雑さなく優れた性能を達成するものです。我々が提案するアプローチはバックボーンへの変更から独立しており、現代のあらゆるモデルに適応可能です。我々の方法は既存の解決策を超えており、複数のデータセットにおいて最新(SOTA)の結果を得ています。FreiHANDデータセットでは、PA-MPJPEが5.7mm、PA-MPVPEが6.0mmという結果を出しています。同様にDexycbデータセットでも、PA-MPJPEが5.5mm、PA-MPVPEが5.0mmという結果を得ました。性能速度については、HRNetを使用した場合最大33フレーム毎秒(fps)、FastViT-MA36を使用した場合は最大70fpsに達しています。

効率的な手のメッシュ再構築のためのシンプルなベースライン | 最新論文 | HyperAI超神経