
要約
我々は、3次元点群に対する効率的なグラフ畳み込みを実現する球面カーネル(spherical kernel)を提案する。本研究で提唱するメトリックに基づくカーネルは、局所的な3次元空間を体系的に量子化することで、データ内に存在する特徴的な幾何学的関係を特定する。従来のグリッド型CNNのカーネルと同様に、球面カーネルは並進不変性(translation-invariance)と非対称性(asymmetry)の性質を保持しており、前者はデータ内の類似した局所構造間で重み共有を保証し、後者は微細な幾何学的学習を促進する。提案手法は、エッジ依存のフィルタ生成を必要とせず、グラフニューラルネットワーク(GNN)に直接適用可能であるため、大規模な点群データに対して計算的に有利である。本研究のグラフネットワークでは、各頂点が単一の点位置に対応し、定義された範囲内の近傍点同士をエッジで接続する。ネットワーク内では、遠方点サンプリング(farthest point sampling)を用いてグラフを粗視化(coarsening)する。標準的なCNNと同様に、本ネットワークにおいてもプーリングおよびアンプーリング操作を定義している。提案する球面カーネルの有効性を、ModelNet、ShapeNet、RueMonge2014、ScanNet、S3DISなどのデータセットを用いた点群分類およびセマンティックセグメンテーションの実験により検証した。ソースコードおよび学習済みモデルは、https://github.com/hlei-ziyan/SPH3D-GCN からダウンロード可能である。