UniDet3D : Détection d'objets 3D en intérieur multi-jeux de données

La demande croissante des clients en matière de solutions intelligentes dans les domaines de la robotique et de la réalité augmentée a attiré une attention considérable sur la détection d'objets 3D à partir de nuages de points. Toutefois, les jeux de données intérieurs existants, pris individuellement, sont trop petits et insuffisamment diversifiés pour entraîner un modèle puissant et généralisable de détection d'objets 3D. Par ailleurs, les approches plus générales fondées sur des modèles fondamentaux restent encore inférieures en qualité à celles basées sur l'apprentissage supervisé pour une tâche spécifique. Dans ce travail, nous proposons UniDet3D, un modèle simple mais efficace pour la détection d'objets 3D, entraîné sur un mélange de jeux de données intérieurs et capable de fonctionner dans divers environnements intérieurs. En unifiant les espaces d'étiquetage différents, UniDet3D permet d'apprendre une représentation robuste à travers plusieurs jeux de données grâce à un schéma d'entraînement conjoint supervisé. L'architecture du réseau proposée repose sur un encodeur Transformer classique, ce qui facilite son exécution, sa personnalisation et son extension pour une utilisation pratique. Des expériences étendues démontrent que UniDet3D obtient des gains significatifs par rapport aux méthodes existantes de détection d'objets 3D sur six benchmarks intérieurs : ScanNet (+1,1 mAP50), ARKitScenes (+19,4 mAP25), S3DIS (+9,1 mAP50), MultiScan (+9,3 mAP50), 3RScan (+3,2 mAP50) et ScanNet++ (+2,7 mAP50). Le code est disponible à l’adresse suivante : https://github.com/filapro/unidet3d.