グラフニューラルネットワークを用いた3Dポイントクラウド処理のための特徴量およびグラフ構築における局所幾何学の活用

3次元点群処理を目的としたグラフニューラルネットワーク(GNN)の一般的な枠組み内において、点表現および局所近傍グラフ構築に関するシンプルでありながら効果的な改善を提案する。第一の貢献として、点の重要な局所幾何学的情報を頂点表現に追加し、その後MLPを用いた非線形射影を行う手法を提案する。第二の貢献として、3次元点群に対するGNNのグラフ構築手法を改善する。従来の手法は、局所近傍グラフの構築にk-NNに基づくアプローチを採用しているが、シーン内の特定領域でセンサーによるサンプリングが密になる場合、その Coverage(カバレッジ)が低下する可能性があると指摘する。本提案手法は、このような問題を是正し、特に高密度サンプリング領域におけるカバレッジの向上を図ることを目的としている。従来のGNNは、頂点に幾何学的解釈が必ずしも存在しない一般のグラフを想定して設計されてきたため、本研究の二つの提案は、3次元点群の幾何学的性質を反映するように一般グラフを拡張するものと捉えられる。提案手法は単純であるが、複数の難易度の高いベンチマークにおいて、比較的クリーンなCADモデルおよび現実世界のノイズを含むスキャンデータを用いて検証した結果、3次元分類(ModelNet40)、部位セグメンテーション(ShapeNet)、セマンティックセグメンテーション(Stanford 3D Indoor Scenes Dataset)の各ベンチマークで最先端の性能を達成している。さらに、提案ネットワークはより高速な学習収束を実現しており、分類タスクにおいて約40%少ないエポック数で収束することが示された。プロジェクトの詳細は以下のURLで公開されている:https://siddharthsrivastava.github.io/publication/geomgcnn/