Command Palette
Search for a command to run...
Lernen aus räumlich-zeitlicher Korrelation für semi-supervises LiDAR-Semantiksegmentierung
Lernen aus räumlich-zeitlicher Korrelation für semi-supervises LiDAR-Semantiksegmentierung
Hal Bie Lee
Zusammenfassung
Wir adressieren die Herausforderungen des semi-überwachten LiDAR-Segmentierungsproblems (SSLS), insbesondere in Szenarien mit geringem Budget. Die beiden Hauptprobleme bei SSLS mit geringem Budget sind die schlecht qualitativierten Pseudo-Labels für nicht gekennzeichnete Daten und die Leistungsabfälle aufgrund der erheblichen Ungleichgewichte zwischen Ground-Truth- und Pseudo-Labels. Dieses Ungleichgewicht führt zu einem schlechten Trainingszyklus. Um diese Herausforderungen zu bewältigen, nutzen wir das räumlich-zeitliche Prior-Wissen, indem wir die erhebliche Überschneidung zwischen zeitlich benachbarten LiDAR-Scans erkennen. Wir schlagen eine näherungsweise Label-Schätzung vor, die durch die Nutzung semantischer Konsistenz mit benachbarten gekennzeichneten Daten hochgenaue Pseudo-Labels für nicht gekennzeichnete Daten generiert. Zudem verbessern wir dieses Verfahren, indem wir die Pseudo-Labels von den nächsten nicht gekennzeichneten Scans aus schrittweise erweitern, was dazu beiträgt, Fehler, die mit dynamischen Klassen verbunden sind, erheblich zu reduzieren. Darüber hinaus setzen wir eine Dual-Branch-Struktur ein, um Leistungsverluste aufgrund des Datenschiefe zu mindern.Experimentelle Ergebnisse zeigen außergewöhnliche Leistungen in Szenarien mit geringem Budget (d.h., <= 5%) und bedeutende Verbesserungen in Szenarien mit normalem Budget (d.h., 5 - 50%). Schließlich hat unsere Methode neue Stand der Technik-Ergebnisse auf SemanticKITTI und nuScenes im Bereich der semi-überwachten LiDAR-Segmentierung erreicht. Mit nur 5% gekennzeichneter Daten liefert sie wettbewerbsfähige Ergebnisse im Vergleich zu vollständig überwachten Methoden. Zudem übertreffen wir die Leistung des bisherigen Standes der Technik bei 100% gekennzeichneter Daten (75,2%) durch die Verwendung von nur 20% gekennzeichneter Daten (76,0%) auf nuScenes. Der Code ist unter https://github.com/halbielee/PLE verfügbar.