11日前

LiDARを用いたユニバーサルエンコーディングとメモリに配慮した回帰を用いたローカライゼーション

{Shangshu Yu}
要約

視覚的局所化は、ロボット工学およびコンピュータビジョンの多くの応用において重要な役割を果たす。絶対姿勢回帰(absolute pose regression)は、シーン特徴を符号化した後に姿勢を回帰する手法であり、局所化において顕著な成果を上げている。この手法は、取得されたシーンデータのみから6自由度(6-DoF)の姿勢を復元可能である。しかし、現行の手法はシーンが変化するたびに特定の元データで再学習を必要とし、計算コストの増大、データプライバシーの漏洩、およびすべてのデータを記憶できないことによる局所化の信頼性低下といった課題を抱えている。本論文では、再学習の冗長性とデータプライバシーの損失を回避するため、普遍的な符号化を用いた新しいLiDARベースの絶対姿勢回帰ネットワークを提案する。具体的には、異なるシーンに対して普遍的な特徴符号化(universal feature encoding)を採用する。これにより、再学習が必要なのは回帰器(regressor)のみとなり、効率が向上する。また、学習は元データを用いずに符号化された特徴量を用いて行われるため、データプライバシーが維持される。さらに、記憶を意識した回帰器(memory regressor)を提案する。この回帰器における隠れユニット数が記憶容量を決定する。これにより、記憶容量の上限を導出し、より信頼性の高い局所化を実現可能となる。また、シーンのサイズに応じた異なる記憶容量要件に適応するため、回帰器の構造を柔軟に変更することが可能である。屋外および屋内データセットを用いた広範な実験により、上記の分析が検証され、提案手法の有効性が示された。

LiDARを用いたユニバーサルエンコーディングとメモリに配慮した回帰を用いたローカライゼーション | 最新論文 | HyperAI超神経