SqueezeSegV2: Verbesserte Modellstruktur und unsupervisierte Domänenanpassung für die Segmentierung von Straßengegenständen aus einem LiDAR-Punktwolken-Datensatz

Frühere Arbeiten haben das Potenzial von tiefen-Lernansätzen für die Segmentierung von Punktwolken gezeigt; jedoch müssen diese Ansätze verbessert werden, um praktisch nutzbar zu sein. Zu diesem Zweck stellen wir ein neues Modell, SqueezeSegV2, vor, das robuster gegenüber Ausfallrauschen in LiDAR-Punktwolken ist. Durch eine verbesserte Modellstruktur, Trainingsverlustfunktion, Batch-Normalisierung und einen zusätzlichen Eingabekanal erreicht SqueezeSegV2 bei der Ausbildung mit realen Daten erhebliche Genauigkeitsverbesserungen. Das Trainieren von Modellen für die Segmentierung von Punktwolken erfordert große Mengen an beschrifteten Punktwolken-Daten, die teuer zu beschaffen sind. Um die Kosten für die Erfassung und Annotation zu umgehen, können Simulatoren wie GTA-V verwendet werden, um unbegrenzte Mengen an beschrifteten synthetischen Daten zu erstellen. Aufgrund des Domänenwechsels verallgemeinern Modelle, die auf synthetischen Daten trainiert wurden, oft nicht gut auf die reale Welt. Wir lösen dieses Problem durch einen Domänenanpassungs-Trainingsprozess, der aus drei Hauptkomponenten besteht: 1) gelernter Intensitätsrendering (learned intensity rendering), 2) geodätische Korrelationsausrichtung (geodesic correlation alignment) und 3) fortschreitende Domänenkalibrierung (progressive domain calibration). Bei der Ausbildung mit realen Daten zeigt unser neues Modell Genauigkeitsverbesserungen von 6,0-8,6 % im Vergleich zum ursprünglichen SqueezeSeg. Wenn wir unser neues Modell unter Verwendung des vorgeschlagenen Domänenanpassungsprozesses mit synthetischen Daten ausbilden, verdoppeln wir fast die Testgenauigkeit auf realen Daten, von 29,0 % auf 57,4 %. Unser Quellcode und unser synthetischer Datensatz werden Open Source veröffentlicht.