17日前

大規模な場所認識のためのピラミッド点群変換器

{Jian Yang, Jin Xie, Mingmei Cheng, Hang Yang, Le Hui}
大規模な場所認識のためのピラミッド点群変換器
要約

近年、深層学習に基づく点群記述子は、場所認識タスクにおいて顕著な成果を上げている。しかし、点群の疎性のため、効率的にグローバル記述子を構築するための判別力のある局所特徴をどのように抽出するかは依然として困難な課題である。本論文では、点群から判別力のあるグローバル記述子を学習し、効率的な検索を実現するためのピラミッド型点群トランスフォーマーネットワーク(PPT-Net)を提案する。具体的には、まず点群の異なる局所k-NNグラフ間の空間的関係を適応的に学習するピラミッド型点群トランスフォーマーモジュールを構築し、グループ化された自己注意(grouped self-attention)を導入することで、点群の判別力のある局所特徴を抽出する。さらに、このグループ化された自己注意は、点群の長距離依存関係を強化するだけでなく、計算コストの低減にも寄与する。判別力のあるグローバル記述子を獲得するために、複数スケールの特徴マップをグローバル記述子に集約するためのピラミッド型VLADモジュールを構築した。複数スケールの特徴マップにVLADプーリングを適用し、複数のグローバル記述子に対してコンテキストゲーティング機構を用いて、複数スケールのグローバルコンテキスト情報を適応的に重み付け、最終的なグローバル記述子に統合する。オックスフォードデータセットおよび3つの自社データセットにおける実験結果から、本手法が点群ベースの場所認識タスクにおいて最先端の性能を達成することが示された。コードは https://github.com/fpthink/PPT-Net にて公開されている。