
要約
近年、大規模な点群から有効な特徴を学習する方法、特に意味的セグメンテーションにおけるアプローチが注目を集めている。この問題に対処するため、本論文では大規模な点群から空間的文脈特徴(Spatial Contextual Features)を学習可能なモジュールを提案する。このモジュールを本稿ではSCF(Spatial Contextual Feature)と呼ぶ。提案するモジュールは、主に3つのブロックから構成されている。まず、局所的な極座標表現ブロックでは、z軸回転に対して不変な空間表現を各3D点に対して構築する。次に、双距離アテンションプーリングブロックを設計し、周囲の点々の幾何学的距離および特徴距離に基づいて、より識別性の高い局所特徴を学習する。最後に、グローバル文脈特徴ブロックを導入し、各3D点の空間的位置と、その近傍領域の点群全体に対する体積比を活用して、グローバルな文脈情報を学習する。提案するモジュールは、点群セグメンテーションに用いられるさまざまなネットワークアーキテクチャに容易に統合可能であり、エンコーダ・デコーダ構造を持つ新たな3D意味的セグメンテーションネットワーク、本稿ではSCF-Netと呼ぶものを自然に構築できる。2つの公開データセットにおける広範な実験結果から、提案するSCF-Netは、多数の状況において既存の最先端手法を上回る性能を示した。