HyperAIHyperAI
vor 2 Monaten

FSD V2: Verbesserung der vollständig dünnen 3D-Objekterkennung durch virtuelle Voxel

Fan, Lue ; Wang, Feng ; Wang, Naiyan ; Zhang, Zhaoxiang
FSD V2: Verbesserung der vollständig dünnen 3D-Objekterkennung durch virtuelle Voxel
Abstract

Die LiDAR-basierte vollständig dünn besetzte Architektur hat zunehmend an Bedeutung gewonnen.FSDv1 hebt sich als repräsentatives Werk hervor, das beeindruckende Effizienz und Effektivität erzielt, auch wenn es komplizierte Strukturen und manuell gestaltete Designs aufweist. In dieser Arbeit stellen wir FSDv2 vor, eine Weiterentwicklung, die darauf abzielt, die frühere FSDv1 zu vereinfachen und den induktiven Bias zu beseitigen, der durch ihre manuell gestaltete instanzbasierte Darstellung eingeführt wurde. Dies fördert eine bessere allgemeine Anwendbarkeit. Zu diesem Zweck führen wir das Konzept der virtuellen Voxel ein, das die clustergestützte Instanzsegmentierung in FSDv1 ablöst. Virtuelle Voxel lösen nicht nur das bekannte Problem des fehlenden Zentrumsmerkmals (Center Feature Missing) in vollständig dünn besetzten Detektoren, sondern verleihen dem Framework auch einen eleganteren und schlankeren Ansatz. Folglich entwickeln wir eine Reihe von Komponenten, um das Konzept der virtuellen Voxel zu ergänzen, darunter einen virtuellen Voxel-Encoder, einen virtuellen Voxel-Mixer und eine Strategie zur Zuordnung von virtuellen Voxel. Durch empirische Validierung zeigen wir, dass der Mechanismus der virtuellen Voxel funktional ähnlich ist wie die manuell gestaltete Clustering in FSDv1, aber allgemeiner anwendbar ist. Wir führen Experimente auf drei großen Datensätzen durch: dem Waymo Open Dataset, dem Argoverse 2-Datensatz und dem nuScenes-Datensatz. Unsere Ergebnisse demonstrieren Spitzenleistungen auf allen drei Datensätzen und unterstreichen die Überlegenheit von FSDv2 in langreichweitigen Szenarien sowie ihre allgemeine Anwendbarkeit zur Erreichung wettbewerbsfähiger Leistungen in verschiedenen Szenarien. Darüber hinaus liefern wir eine umfassende experimentelle Analyse, um die Funktionsweise von FSDv2 zu erläutern. Um Wiederholbarkeit und weitere Forschungen zu fördern, haben wir FSDv2 unter https://github.com/tusen-ai/SST öffentlich zugänglich gemacht.

FSD V2: Verbesserung der vollständig dünnen 3D-Objekterkennung durch virtuelle Voxel | Neueste Forschungsarbeiten | HyperAI