17日前

TriHorn-Net:高精度深度ベース3D手の姿勢推定のためのモデル

Mohammad Rezaei, Razieh Rastgoo, Vassilis Athitsos
TriHorn-Net:高精度深度ベース3D手の姿勢推定のためのモデル
要約

近年、3次元手のポーズ推定手法は顕著な進展を遂げている。しかし、特定の実世界応用においては、推定精度が依然として十分ではなく、さらなる改善の余地が大きい。本論文では、深度画像上で手のポーズ推定精度を向上させるために、特異な革新を導入した新しいモデル「TriHorn-Net」を提案する。第一の革新は、3次元手のポーズ推定を、深度画像空間(UV)における2次元関節位置の推定と、2つの補完的アテンションマップを用いて補助された対応する深度の推定に分解することである。この分解により、より困難な深度推定が予測段階および特徴量レベルでUV推定に悪影響を及ぼすことを防ぐことができる。第二の革新は「PixDropout」であり、知られている限り、これは手の深度画像に対する初の外観に基づくデータ拡張手法である。実験結果から、提案手法が3つの公的ベンチマークデータセットにおいて、最先端の手法を上回ることを示した。本研究の実装コードは、https://github.com/mrezaei92/TriHorn-Net で公開されている。

TriHorn-Net:高精度深度ベース3D手の姿勢推定のためのモデル | 最新論文 | HyperAI超神経