HyperAIHyperAI
il y a 2 mois

SqueezeSegV2 : Amélioration de la structure du modèle et adaptation de domaine non supervisée pour la segmentation d'objets routiers à partir d'un nuage de points LiDAR

Bichen Wu; Xuanyu Zhou; Sicheng Zhao; Xiangyu Yue; Kurt Keutzer
SqueezeSegV2 : Amélioration de la structure du modèle et adaptation de domaine non supervisée pour la segmentation d'objets routiers à partir d'un nuage de points LiDAR
Résumé

Des travaux antérieurs ont démontré le potentiel des approches basées sur l'apprentissage profond pour la segmentation de nuages de points ; cependant, ces approches doivent être améliorées pour être utiles en pratique. À cet égard, nous présentons un nouveau modèle, SqueezeSegV2, qui est plus robuste face au bruit de dropout dans les nuages de points LiDAR. Grâce à une structure de modèle améliorée, une fonction de perte d'entraînement optimisée, une normalisation par lots (batch normalization) et un canal d'entrée supplémentaire, SqueezeSegV2 réalise des améliorations significatives en termes de précision lorsqu'il est entraîné sur des données réelles. L'entraînement de modèles pour la segmentation de nuages de points nécessite de grandes quantités de données de nuages de points étiquetés, ce qui est coûteux à obtenir. Pour contourner les coûts de collecte et d'annotation, des simulateurs comme GTA-V peuvent être utilisés pour créer des quantités illimitées de données synthétiques étiquetées. Cependant, en raison du décalage entre les domaines (domain shift), les modèles entraînés sur des données synthétiques ne généralisent souvent pas bien au monde réel. Nous abordons ce problème grâce à une pipeline d'adaptation de domaine composée de trois éléments principaux : 1) rendu d'intensité appris (learned intensity rendering), 2) alignement par corrélation géodésique (geodesic correlation alignment), et 3) calibration progressive du domaine (progressive domain calibration). Lorsque notre nouveau modèle est entraîné sur des données réelles, il montre des améliorations en précision de segmentation allant jusqu'à 6,0-8,6% par rapport au SqueezeSeg original. Lorsque nous entraînons notre nouveau modèle sur des données synthétiques en utilisant la pipeline d'adaptation de domaine proposée, nous presque doublons la précision des tests sur des données réelles, passant de 29,0% à 57,4%. Notre code source et notre ensemble de données synthétiques seront mis à disposition sous licence open-source.

SqueezeSegV2 : Amélioration de la structure du modèle et adaptation de domaine non supervisée pour la segmentation d'objets routiers à partir d'un nuage de points LiDAR | Articles de recherche récents | HyperAI