
要約
本稿では、制約のないエンドツーエンド型の頭部姿勢推定手法を提案する。従来の回転ラベルの曖昧性という問題に対し、教師データに対して回転行列形式を導入し、効率的かつ堅牢な直接回帰を可能にする連続的な6次元回転行列表現を提案する。これにより、本手法は広範な回転範囲を学習可能となる一方で、従来の手法が良好な結果を得るためには狭角範囲に制限されていたのに対し、より包括的な姿勢表現を可能にする。さらに、SO(3)多様体の幾何構造を考慮した測地線距離に基づく損失関数を提案し、ネットワークの学習を多様体構造に適応させる。公開データセットAFLW2000およびBIWIにおける実験結果から、本手法が他の最先端手法を最大20%の性能向上で上回ることが示された。本研究の学習および評価用コード、および事前学習済みモデルをオープンソースとして公開している:https://github.com/thohemp/6DRepNet。