Klassenbalancierte Gruppierung und Stichprobenziehung für die 3D-Objekterkennung in Punktwolken

Dieser Bericht stellt unsere Methode vor, die den nuScenes 3D-Detektionswettbewerb [17], der im Rahmen des Workshops on Autonomous Driving (WAD, CVPR 2019) stattfand, gewonnen hat. Im Allgemeinen nutzen wir dünnbesetzte 3D-Faltungen (sparse 3D convolution), um reichhaltige semantische Merkmale zu extrahieren. Diese werden anschließend in ein klassenbalanciertes Multi-Head-Netzwerk eingespeist, um die 3D-Objekterkennung durchzuführen. Um das schwere Problem der Klassenungleichverteilung, das in autonomen Fahrzeugszenarien inhärent ist, zu bewältigen, haben wir eine klassenbalancierte Stichprobenziehung und Verstärkungsstrategie entwickelt, um eine ausgewogener verteilte Datenmenge zu generieren. Darüber hinaus schlagen wir einen balancierten Gruppierungs-Head vor, um die Leistung für Kategorien mit ähnlichen Formen zu verbessern. Auf Basis der Wettbewerbsergebnisse übertrifft unsere Methode den PointPillars-Basisline [14] bei allen Metriken deutlich und erreicht den Stand der Technik in der Detektionsleistung auf dem nuScenes-Datensatz. Der Code wird bei CBGS veröffentlicht werden.