
要約
本研究では、非構造化点群に対する新しい汎用的かつ効率的なラベリング手法を提案する。3次元データ上で深層畳み込みニューラルネットワーク(CNN)を効率的に活用するという問題は依然として未解決の課題であるため、点群の複数の2次元画像ビュー(またはスナップショット)にCNNを適用するフレームワークを提案する。本手法は以下の3つの核心的なアイデアから構成される。(i)適切な点群スナップショットを多数選定する。具体的には、RGB画像と、幾何学的特徴を含む深度合成画像の2種類の画像を生成する。(ii)その後、完全畳み込みネットワーク(Fully Convolutional Networks)を用いて、各2次元スナップショットペアに対して画素単位のラベリングを実施する。異なるネットワークアーキテクチャを検証し、異種入力データの有効な統合を実現する。(iii)最後に、効率的なバッファリングを用いた高速な3次元空間へのラベル予測のバックプロジェクションにより、すべての3次元点にラベルを付与する。実験の結果、本手法がLiDARデータや写真測量データなど、さまざまな種類の点群データに対して有効であることが示された。