要約
点群は3次元データの適切な表現形式として広く受け入れられており、大多数の3次元センサーはこのデータを生成する能力を有している。しかし、点群は不規則な構造を持つため、深層学習アルゴリズムを用いた解析は非常に困難である。本稿では、点と平面の距離という概念を活用し、空間的な局所相関を効果的に捉えることを目的として、新しい畳み込みニューラルネットワーク「Point-PlaneNet」を提案する。本手法では、Rⁿ空間内に学習される一連の平面を用いて点群から局所的な幾何学的特徴を抽出する、シンプルな局所演算「PlaneConv」を導入している。本ネットワークは入力として生の点群を直接扱うため、点群を画像やボリュームに変換する必要がなく、前処理の煩雑さを回避できる。PlaneConvは理論的にも簡潔であり、深層学習モデルへの組み込みが容易で、モデル性能の向上に寄与する。提案手法の分類、パーツセグメンテーション、シーンセマンティックセグメンテーションにおける有効性を検証するため、ModelNet-40、MNIST、ShapeNet-Part、S3DISの4つのデータセットを用いた実験を行った。実験結果から、すべてのタスクにおいて従来手法と比較して妥当な性能を示すことが明らかになった。