PointRCNN : Génération de propositions d'objets 3D et détection à partir du nuage de points

Dans cet article, nous proposons PointRCNN pour la détection d'objets 3D à partir de nuages de points bruts. L'ensemble du cadre est composé de deux étapes : l'étape 1 pour la génération de propositions 3D ascendantes et l'étape 2 pour le raffinement des propositions dans les coordonnées canoniques afin d'obtenir les résultats finaux de détection. Contrairement aux méthodes précédentes qui génèrent des propositions à partir d'images RGB ou projettent le nuage de points en vue aérienne ou en voxels, notre sous-réseau de l'étape 1 génère directement un petit nombre de propositions 3D de haute qualité à partir du nuage de points par une segmentation ascendante, distinguant les points d'avant-plan des points d'arrière-plan. Le sous-réseau de l'étape 2 transforme les points regroupés de chaque proposition en coordonnées canoniques pour apprendre des caractéristiques spatiales locales améliorées, qui sont combinées avec les caractéristiques sémantiques globales de chaque point apprises lors de l'étape 1, afin d'affiner précisément les boîtes englobantes et prédire leur confiance. De nombreuses expérimentations sur le banc d'essai de détection 3D du jeu de données KITTI montrent que notre architecture proposée surpassent les méthodes actuelles avec des marges notables en utilisant uniquement le nuage de points comme entrée. Le code est disponible sur https://github.com/sshaoshuai/PointRCNN.