HyperAIHyperAI
vor 17 Tagen

MuGNet: Multi-Resolution Graph Neural Network für die Segmentierung großer Punktwolken

{Kenji Shimada, Tomotake Furuhata, Liuyue Xie}
Abstract

In diesem Artikel stellen wir eine mehrschalige, tiefenlernenbasierte Architektur zur semantischen Segmentierung dichter, großflächiger Punktwolken vor. Dichte Punktwolken-Daten erfordern einen rechenintensiven Prozess zur Merkmalskodierung, bevor eine semantische Segmentierung durchgeführt werden kann. Frühere Ansätze haben unterschiedliche Methoden verwendet, um die ursprüngliche Punktwolke stark zu verkleinern, damit übliche Rechenhardware genutzt werden kann. Obwohl diese Ansätze die Rechenlast teilweise reduzieren, sind sie dennoch begrenzt hinsichtlich ihrer Verarbeitungskapazität für mehrere Scan-Daten. Wir präsentieren MuGNet, einen speicher-effizienten, end-to-end-Graphen-Neural-Netzwerk-Framework zur semantischen Segmentierung großer Punktwolken. Durch die Nutzung eines Graphen-Neural-Netzwerks auf vorverarbeiteten Punktwolken-Graphen wird der Rechenaufwand reduziert, während eine bidirektionale Architektur zur Fusions von Merkmalsdarstellungen auf unterschiedlichen Auflösungsebenen die Genauigkeit der Segmentierung beibehält. Unser Framework wurde an Benchmark-Datensätzen wie dem Stanford Large-Scale 3D Indoor Spaces Dataset (S3DIS) und dem Virtual KITTI Dataset validiert. Wir zeigen, dass unser Ansatz bis zu 45 Raum-Scans gleichzeitig auf einer einzigen GPU mit 11 GB Speicher verarbeiten kann, wobei die Segmentierungsergebnisse auf S3DIS sowohl eine Gesamtgenauigkeit von 88,5 % (+3 %) als auch eine mIOU-Genauigkeit von 69,8 % (+7,7 %) erreichen – und damit andere graphbasierte Lösungen übertreffen.