Ce qui peut être vu est ce que vous obtenez : augmentation de nuage de points sensible à la structure

Pour entraîner un réseau de neurones performant pour la segmentation sémantique, il est essentiel de disposer d’un grand jeu de données comprenant des vérités terrain (ground truth) permettant au modèle de généraliser sur des données inédites. Dans cet article, nous présentons de nouvelles méthodes d’augmentation de nuages de points visant à diversifier artificiellement un jeu de données. Nos approches centrées sur le capteur préservent la structure des données en cohérence avec les capacités des capteurs lidar. Grâce à ces nouvelles méthodes, il devient possible d’enrichir des données à faible valeur avec des instances à haute valeur, voire de générer des scènes entièrement nouvelles. Nous validons nos méthodes sur plusieurs réseaux de neurones en utilisant le jeu de données public SemanticKITTI, et démontrons que tous les réseaux améliorent leurs performances par rapport à leurs versions de base. En outre, nous montrons que nos méthodes permettent d’utiliser des jeux de données extrêmement petits, réduisant ainsi considérablement le temps d’annotation, le temps d’entraînement et les coûts associés.