Souvenez-vous... de l’avenir ? Généralisation faible-vers-forte dans la détection d’objets 3D

Cette étude présente une nouvelle méthode pour la détection d'objets 3D à partir de données LiDAR, visant à surmonter des défis majeurs dans ce domaine : la sparsité des nuages de points et les occlusions. Notre approche exploite des séquences temporelles de nuages de points afin de générer des trames offrant des vues complètes des objets sous plusieurs angles. Pour relever le défi de la génération de ces trames en temps réel, nous utilisons la distillation de connaissances dans un cadre enseignant-étudiant, permettant au modèle étudiant de reproduire la perception avancée de l'enseignant. Nous avons introduit pour la première fois l’approche de généralisation faible-vers-forte en vision par ordinateur, en entraînant notre modèle enseignant sur des données enrichies et complètes en objets. Dans cette démonstration, nous mettons en évidence la qualité exceptionnelle des étiquettes produites par l’enseignant X-Ray sur des trames complètes en objets, illustrant ainsi la capacité de notre méthode à extraire et à transférer ses connaissances afin d’améliorer les modèles de détection d’objets 3D.