Was gesehen werden kann, ist, was Sie erhalten: strukturbewusste Punktwolken-Erweiterung

Um ein leistungsstarkes neuronales Netzwerk für die semantische Segmentierung zu trainieren, ist es entscheidend, über einen großen Datensatz mit verfügbaren Ground-Truth-Markierungen zu verfügen, damit das Netzwerk auf unbekannte Daten generalisieren kann. In diesem Paper stellen wir neuartige Augmentationsmethoden für Punktwolken vor, um künstlich die Vielfalt eines Datensatzes zu erhöhen. Unsere sensorzentrierten Ansätze bewahren die Datenstruktur konsistent mit den Fähigkeiten von Lidar-Sensoren. Durch diese neuen Methoden gelingt es uns, datenarmes Material mit hochwertigen Instanzen zu bereichern sowie vollständig neue Szenen zu generieren. Wir validieren unsere Ansätze an mehreren neuronalen Netzwerken anhand des öffentlichen SemanticKITTI-Datensatzes und zeigen, dass alle Netzwerke gegenüber ihren jeweiligen Baselines eine Verbesserung erzielen. Zudem demonstrieren wir, dass unsere Methoden die Nutzung äußerst kleiner Datensätze ermöglichen, was Zeit für die Annotation, Trainingszeit und damit verbundene Kosten erheblich reduziert.