HyperAIHyperAI
il y a 11 jours

Denoisage par rayons : échantillonnage sélectif d’éléments négatifs difficiles fondé sur la profondeur pour la détection 3D multi-vues d’objets

Feng Liu, Tengteng Huang, Qianjing Zhang, Haotian Yao, Chi Zhang, Fang Wan, Qixiang Ye, Yanzhao Zhou
Denoisage par rayons : échantillonnage sélectif d’éléments négatifs difficiles fondé sur la profondeur pour la détection 3D multi-vues d’objets
Résumé

Les systèmes de détection 3D à plusieurs vues peinent souvent à produire des prédictions précises en raison des difficultés inhérentes à l'estimation de la profondeur à partir d'images, ce qui entraîne une augmentation des détections redondantes et erronées. Notre article présente Ray Denoising, une méthode innovante qui améliore la précision de détection en échantillonnant de manière stratégique le long des rayons camera afin de construire des exemples négatifs difficiles. Ces exemples, visuellement proches des véritables positifs, obligent le modèle à apprendre des caractéristiques sensibles à la profondeur, renforçant ainsi sa capacité à distinguer les vrais positifs des faux positifs. Ray Denoising est conçu comme un module plug-and-play, compatible avec tout détecteur 3D à plusieurs vues de type DETR, et n'augmente que très légèrement les coûts computationnels durant l'entraînement sans impacter la vitesse d'inférence. Nos expériences approfondies, incluant des études d'ablation détaillées, démontrent de manière cohérente que Ray Denoising surpasse les méthodes de référence fortes sur plusieurs jeux de données. Il atteint une amélioration de 1,9 % en moyenne de la précision moyenne (mAP) par rapport à la méthode de pointe StreamPETR sur le jeu de données NuScenes. Des gains significatifs sont également observés sur le jeu de données Argoverse 2, mettant en évidence sa capacité de généralisation. Le code source sera disponible à l’adresse suivante : https://github.com/LiewFeng/RayDN.

Denoisage par rayons : échantillonnage sélectif d’éléments négatifs difficiles fondé sur la profondeur pour la détection 3D multi-vues d’objets | Articles de recherche récents | HyperAI