17日前

HandAugment:深度に基づく3Dハンドポーズ推定のためのシンプルなデータ拡張手法

Zhaohui Zhang, Shipeng Xie, Mingxiu Chen, Haichao Zhu
HandAugment:深度に基づく3Dハンドポーズ推定のためのシンプルなデータ拡張手法
要約

3D深度画像からの手のポーズ推定は、コンピュータビジョン分野において、多様な技術を用いて広く研究されてきた。近年、ディープラーニングに基づく手法により性能は著しく向上しているものの、ImageNetのような大規模データセットや効果的なデータ合成手法の不足により、この問題は依然として完全に解決されていない。本論文では、ニューラルネットワークの学習プロセスを拡張するための画像データ合成手法「HandAugment」を提案する。本手法は主に2つの構成要素からなる。第一に、手領域に注目できるようにする二段階型ニューラルネットワークの構成スキームを提案する。これにより、ネットワークの性能が向上する。第二に、画像空間内で実画像と合成画像を単純かつ効果的に組み合わせるデータ合成手法を導入する。最終的に、HANDS 2019チャレンジにおける深度画像に基づく3D手のポーズ推定タスクにおいて、本手法が首位を獲得したことを示した。