HyperAIHyperAI
il y a 2 mois

FSD V2 : Amélioration de la détection d'objets 3D entièrement creuse avec des voxels virtuels

Fan, Lue ; Wang, Feng ; Wang, Naiyan ; Zhang, Zhaoxiang
FSD V2 : Amélioration de la détection d'objets 3D entièrement creuse avec des voxels virtuels
Résumé

L'architecture entièrement éparse basée sur LiDAR a suscité une attention croissante. FSDv1 se distingue comme une œuvre représentative, atteignant une efficacité et une efficience impressionnantes, bien que dotée de structures complexes et de conceptions manuelles. Dans cet article, nous présentons FSDv2, une évolution visant à simplifier le précédent FSDv1 tout en éliminant le biais inductif introduit par sa représentation d'instances conçue manuellement, afin de promouvoir une meilleure applicabilité générale. À cette fin, nous introduisons le concept de voxels virtuels, qui remplace la segmentation d'instances basée sur le regroupement dans FSDv1. Les voxels virtuels non seulement résolvent le problème notoire de la disparition des caractéristiques centrales (Center Feature Missing) dans les détecteurs entièrement éparse, mais dotent également le cadre d'une approche plus élégante et fluide. Par conséquent, nous développons un ensemble de composants pour compléter le concept de voxels virtuels, incluant un encodeur de voxels virtuels, un mélangeur de voxels virtuels et une stratégie d'affectation de voxels virtuels. Par validation empirique, nous démontrons que le mécanisme des voxels virtuels est fonctionnellement similaire au regroupement conçu manuellement dans FSDv1 tout en étant plus général. Nous menons des expériences sur trois grands ensembles de données : l'ensemble de données ouvert Waymo (Waymo Open Dataset), l'ensemble de données Argoverse 2 et l'ensemble de données nuScenes. Nos résultats mettent en lumière des performances d'avant-garde sur les trois ensembles de données, soulignant la supériorité de FSDv2 dans les scénarios à longue portée et son applicabilité générale pour obtenir des performances compétitives dans divers scénarios. De plus, nous fournissons une analyse expérimentale complète pour clarifier le fonctionnement de FSDv2. Pour favoriser la reproductibilité et la recherche ultérieure, nous avons rendu FSDv2 open-source à l'adresse https://github.com/tusen-ai/SST.

FSD V2 : Amélioration de la détection d'objets 3D entièrement creuse avec des voxels virtuels | Articles de recherche récents | HyperAI