17日前

MuGNet:大規模ポイントクラウドセグメンテーションのための多解像度グラフニューラルネットワーク

{Kenji Shimada, Tomotake Furuhata, Liuyue Xie}
要約

本稿では、高密度かつ大規模な点群データに対する意味的セグメンテーションを実現するためのマルチリゾリューション深層学習アーキテクチャを提案する。高密度点群データは、意味的セグメンテーションを行う前に計算コストが非常に高い特徴エンコーディング処理を必要とする。従来の手法では、一般的な計算ハードウェアを活用できるように、元の点群データを大幅にダウンサンプリングするアプローチが採用されていた。これらの手法は計算負荷を一定程度軽減できるものの、複数のスキャンデータを処理する能力には限界がある。そこで本研究では、メモリ効率が高く、エンド・ツー・エンドのグラフニューラルネットワーク(GNN)フレームワークであるMuGNetを提案する。本手法は、事前に構築された点群グラフ上でGNNを用いることで計算負荷を低減するとともに、異なるリゾリューションでの特徴埋め込みを双向(バイディレクショナル)に融合するネットワーク構造により、セグメンテーションの精度を維持する。本フレームワークは、Stanford Large-Scale 3D Indoor Spaces Dataset(S3DIS)およびVirtual KITTI Datasetを含む標準ベンチマークデータセット上で検証された。実験の結果、単一の11GB GPU上で最大45室分のスキャンデータを一度に処理可能であり、S3DISにおける全体的な正確率(overall accuracy)で88.5%(+3%)を達成し、mIOU(mean Intersection over Union)では69.8%(+7.7%)を記録。これにより、従来のグラフベースの手法を上回る性能を示した。