TORNADO-Net: mulTiview tOtal vaRiatioN semAntic segmentation mit Diamond inceptiOn modul

Die semantische Segmentierung von Punktwolken ist eine zentrale Komponente der Szenenverstehens für Robotik und autonome Fahrzeuge. In diesem Paper stellen wir TORNADO-Net vor – ein neuronales Netzwerk für die semantische Segmentierung von 3D-LiDAR-Punktwolken. Wir kombinieren eine mehrere Ansicht (Bird’s-Eye- und Range-) Projektions-basierte Merkmalsextraktion mit einer Encoder-Decoder-ResNet-Architektur, die einen neuartigen Diamant-Kontext-Block integriert. Aktuelle projektierte Methoden berücksichtigen nicht, dass benachbarte Punkte in der Regel der gleichen Klasse angehören. Um diese lokale Nachbarschaftsinformation besser auszunutzen und rauschbehaftete Vorhersagen zu reduzieren, führen wir eine Kombination aus Total Variation-, Lovasz-Softmax- und gewichteter Cross-Entropy-Verlustfunktionen ein. Zudem nutzen wir die Tatsache aus, dass LiDAR-Daten einen 360-Grad-Sichtfeldumfang aufweisen und kreisförmige Padding-Techniken verwenden. Wir demonstrieren state-of-the-art-Ergebnisse auf dem SemanticKITTI-Datensatz und liefern zudem umfassende quantitative Evaluationen sowie Ablationsstudien.