
要約
本稿では、無構造な点群から3Dモデルの認識を行うための新しい深層学習アーキテクチャであるPointGridを提案する。この新アーキテクチャは、単純ながら効果的なサンプリング戦略により入力点群を3Dグリッドに埋め込み、その生の座標から変換および特徴を直接学習する。提案手法は点群とグリッドの統合を図ったハイブリッドモデルであり、VoxelNetなどのグリッドベース手法のシンプルさを活かしつつ、それらに伴う情報損失を回避する。PointNetと比較してより優れたグローバル情報の学習が可能であり、PointNet++、Kd-Net、Oct-Net、O-CNNと比べてはるかに単純であるにもかかわらず、同等の認識精度を実現している。代表的な形状認識ベンチマークを用いた実験により、PointGridは分類およびセグメンテーションの両タスクにおいて、従来の深層学習手法と比較して競争力のある性能を示している。