
要約
本論文では、場所認識の目的のために差別的な3D点群記述子を計算する学習ベースの手法を提案しています。既存の手法(例:PointNetVLAD)は、順序付けられていない点群表現に基づいています。これらの手法は、PointNetを最初の処理ステップとして使用して局所特徴を抽出し、その後、それらを全体的な記述子に集約します。しかし、PointNetアーキテクチャは局所的な幾何構造を捉えるのに適していないため、最先端の手法では、グラフ畳み込みネットワークや手作りの特徴量を使用するなど、局所的なコンテキスト情報を捉えるための異なるメカニズムを追加することで、基本的なPointNetアーキテクチャを強化しています。本稿では、疎なボクセル化された点群表現と疎な3D畳み込みに基づく差別的な3D点群記述子を計算する代替的手法であるMinkLoc3Dについて紹介します。提案手法はシンプルで効率的なアーキテクチャを持っています。標準的なベンチマークでの評価により、MinkLoc3Dが現行の最先端技術を超えることが証明されています。当該コードはプロジェクトウェブサイトで公開されており、以下のURLからアクセスできます:https://github.com/jac99/MinkLoc3D