HyperAIHyperAI
vor 11 Tagen

Einführung eines Sparse Transformer in den Single-Stride-3D-Objektdetektor

Lue Fan, Ziqi Pang, Tianyuan Zhang, Yu-Xiong Wang, Hang Zhao, Feng Wang, Naiyan Wang, Zhaoxiang Zhang
Einführung eines Sparse Transformer in den Single-Stride-3D-Objektdetektor
Abstract

Bei der LiDAR-basierten 3D-Objekterkennung für autonome Fahrzeuge ist das Verhältnis der Objektgröße zur Eingabescenegröße im Vergleich zu 2D-Erkennungsaufgaben erheblich kleiner. Indem diese Unterschiede vernachlässigt werden, übernehmen viele 3D-Detektoren direkt die gängigen Praktiken aus der 2D-Objekterkennung, wobei die Feature-Maps bereits nach der Quantisierung der Punktwolken heruntergekoppelt werden. In diesem Paper überdenken wir zunächst, wie sich solch ein Multi-Stride-Paradigma auf LiDAR-basierte 3D-Objektdetektoren auswirkt. Unsere Experimente zeigen, dass die Herunterkoppelung wenig Vorteile bietet und zwangsläufig zu Informationsverlust führt. Um dieses Problem zu beheben, schlagen wir den Single-Stride Sparse Transformer (SST) vor, der von Anfang bis Ende die ursprüngliche Auflösung beibehält. Mit Hilfe von Transformers löst unsere Methode das Problem des begrenzten Empfindungsfeldes bei Single-Stride-Architekturen. Zudem arbeitet sie gut mit der Sparsität der Punktwolken zusammen und vermeidet auf natürliche Weise rechenintensive Operationen. Schließlich erreicht unser SST führende Ergebnisse auf dem großen Waymo Open Dataset. Besonders hervorzuheben ist, dass unsere Methode aufgrund der Eigenschaften des Single-Stride-Ansatzes beeindruckende Leistung (83,8 LEVEL 1 AP auf dem Validierungssplit) bei der Erkennung kleiner Objekte (Fußgänger) erzielt. Der Quellcode wird unter https://github.com/TuSimple/SST veröffentlicht.

Einführung eines Sparse Transformer in den Single-Stride-3D-Objektdetektor | Neueste Forschungsarbeiten | HyperAI