2ヶ月前

GPV-Pose: ジオメトリガイダンスによるカテゴリー単位の物体姿勢推定

Di, Yan ; Zhang, Ruida ; Lou, Zhiqiang ; Manhardt, Fabian ; Ji, Xiangyang ; Navab, Nassir ; Tombari, Federico
GPV-Pose: ジオメトリガイダンスによるカテゴリー単位の物体姿勢推定
要約

最近、6Dオブジェクト姿勢推定は大きな進歩を遂げましたが、ほとんどの手法はまだ単一のオブジェクトまたは少数の異なるオブジェクトしか処理できず、これがその応用範囲を制限しています。この問題を解決するために、カテゴリレベルのオブジェクト姿勢推定が最近見直され、特定のオブジェクトクラス群から初めて見るインスタンスに対して6D姿勢と3D計量サイズを予測することを目指しています。しかし、これはクラス内の形状変動が激しいため、非常に困難な課題となっています。この課題に対処するため、我々はGPV-Poseという新しいフレームワークを提案します。これは、幾何学的な洞察を利用してカテゴリレベルの姿勢に敏感な特徴の学習を強化する堅牢な categoria-level 姿勢推定手法です。まず、分離型信頼度駆動回転表現(decoupled confidence-driven rotation representation)を導入し、これにより関連する回転行列の幾何学的に意識した復元が可能になります。次に、堅牢な3Dオブジェクトバウンディングボックスの取得のために新たな幾何学誘導点ごとの投票パラダイム(geometry-guided point-wise voting paradigm)を提案します。最後に、これらの異なる出力ストリームを利用することで、複数の幾何学的一貫性項(geometric consistency terms)を強制できます。これにより特に非対称的なカテゴリでの性能向上が期待されます。GPV-Poseは一般的な公開ベンチマークにおいて最先端の競合他社よりも優れた結果を示しており、20 FPSでほぼリアルタイム推論速度も達成しています。