2ヶ月前

キーポイントなしの詳細なヘッドポーズ推定

Nataniel Ruiz; Eunji Chong; James M. Rehg
キーポイントなしの詳細なヘッドポーズ推定
要約

人の頭部姿勢を推定することは、視線推定の支援、注意のモデリング、ビデオへの3Dモデルの適合、顔合わせなどの多くの応用を持つ重要な問題です。従来の方法では、対象の顔からいくつかのキーポイントを推定し、平均的な人間の頭部モデルを使用して2Dから3Dへの対応問題を解いていました。しかし、この方法はランドマーク検出性能、外部の頭部モデル、および即席の適合ステップに完全に依存しているため脆弱であると主張します。本研究では、300W-LP(大規模な合成拡張データセット)上で多目的損失関数を持つ畳み込みニューラルネットワークを訓練し、画像強度から直接内在的なオイラー角(ヨー角、ピッチ角、ロール角)を予測する優雅で堅牢な方法を提案します。これは共同ビン化された姿勢分類と回帰を通じて実現されます。一般的な野外姿勢ベンチマークデータセットでの経験的テスト結果を示し、最先端の成果と同等の結果を得ています。さらに、通常は深度情報を使用して姿勢推定を行うデータセットでもテストを行い、最先端の深度情報に基づく姿勢推定手法との差異を縮めつつあります。当方はオープンソースとして訓練およびテストコードを公開するとともに、事前学習済みモデルも提供しています。

キーポイントなしの詳細なヘッドポーズ推定 | 最新論文 | HyperAI超神経