11日前

キーポイントを用いない頭部ポーズ推定のための効果的なディープネットワーク

Chien Thai, Viet Tran, Minh Bui, Huong Ninh, Hai Tran
キーポイントを用いない頭部ポーズ推定のための効果的なディープネットワーク
要約

近年、顔認識分野における人間の頭部ポーズ推定は、視線推定、バーチャルリアリティ、ドライバー支援システムなど、多くのコンピュータビジョン応用に不可欠な問題として注目されている。頭部ポーズ推定の重要性を踏まえ、大規模なカメラ監視システムやAIカメラなど、顔認識に基づくアプリケーションに展開する際の計算コストを低減しつつ、精度を維持するためには、コンパクトなモデルの設計が不可欠である。本研究では、頭部ポーズ推定問題を効果的に解決する軽量モデルを提案する。本手法は以下の2段階から構成される。1) まず、合成データセットである300W-LPA上で多数の教師モデルを学習し、頭部ポーズの擬似ラベルを取得する。2) その後、ResNet18をバックボーンとするアーキテクチャを設計し、得られたこれらの擬似ラベルのアンサンブルを用いて知識蒸留(knowledge distillation)プロセスにより、提案モデルを学習する。モデルの有効性を評価するため、実世界の頭部ポーズデータセットであるAFLW-2000およびBIWIを用いて実験を行った。実験結果から、最先端の頭部ポーズ推定手法と比較して、本提案モデルは顕著な精度向上を達成したことが示された。さらに、Tesla V100上で推論を行う場合、本モデルは約300 FPSというリアルタイム性能を実現している。