11日前

FSA-Net:単一画像からの頭部ポーズ推定を 위한細粒度構造集約の学習

{ Yung-Yu Chuang, Yen-Yu Lin, Yi-Ting Chen, Tsun-Yi Yang}
FSA-Net:単一画像からの頭部ポーズ推定を 위한細粒度構造集約の学習
要約

本稿では、単一画像から頭部姿勢を推定する手法を提案する。従来の手法は、ランドマーク推定または深度推定を経由して頭部姿勢を予測するものが多く、必要以上に計算負荷が高い傾向にあった。本手法は回帰と特徴集約に基づくものであり、モデルのコンパクト化を図るためにソフトステージワイズ回帰スキームを採用している。既存の特徴集約手法は入力を特徴の集合(bag of features)として扱うため、特徴マップ内の空間的関係性を無視してしまう。そこで、集約の前に特徴を空間的にグループ化するための細粒度構造マッピングを学習する手法を提案する。この細粒度構造は部位ベースの情報とプール化された値を提供する。空間的位置における学習可能・非学習可能な重要度を活用することで、異なるモデルバリエーションを生成し、補完的なアンサンブルを構成できる。実験の結果、本手法はランドマークに依存しない手法を含む最先端手法を上回ることを示した。また、RGB単一フレームを入力として用いるにもかかわらず、RGB-DやRGB-Timeといったマルチモーダル情報を用いる手法よりもヨー角の推定精度が優れている。さらに、本モデルのメモリオーバーヘッドは従来手法と比較して100分の1にまで削減されている。

FSA-Net:単一画像からの頭部ポーズ推定を 위한細粒度構造集約の学習 | 最新論文 | HyperAI超神経