11日前

データ駆動型アプローチによる3Dヘッドポーズ推定の向上

{Eraldo Ribeiro, Nima Aghli}
要約

画像からの頭部姿勢推定は、コンピュータビジョン分野における重要な研究課題である。その応用例として、注目領域の検出、ドライバー行動の追跡、ヒューマンコンピュータインタラクション(HCI)などがある。近年の頭部姿勢推定に関する研究では、深層畳み込みニューラルネットワーク(CNN)に基づくモデルの開発が主な焦点となっている。これらのモデルは、転移学習(transfer learning)および画像増強(image augmentation)を活用して、初期状態の向上と遮蔽(occlusion)に対するロバスト性の強化を図っている。しかし、従来の転移学習手法は一般的な画像認識タスクを対象としており、顔認識などタスクに特化したネットワークからの転移学習についての深層的な検討はほとんど行われていない。さらに、頭部姿勢推定においては、重度の遮蔽や運動ブラー、低輝度といったノイズに対する耐性が極めて重要である。本論文では、頭部姿勢推定モデルの推定精度を顕著に向上させる新たな画像増強手法を提案する。また、顔認識などの顔関連タスクに特化して学習されたモデルの内部活性化(internal activations)を分析することで、タスクに適した重み初期化手法を提案し、さらなる精度向上を実現した。提案手法は、3つの困難なテストデータセットを用いて評価され、既存の最先端手法と比較して優れた結果を達成した。

データ駆動型アプローチによる3Dヘッドポーズ推定の向上 | 最新論文 | HyperAI超神経