Détection et suivi d'objets 3D basés sur un centre

Les objets tridimensionnels sont couramment représentés sous forme de boîtes 3D dans un nuage de points. Cette représentation imite la détection de boîtes englobantes 2D bien étudiée basée sur les images, mais elle présente des défis supplémentaires. Les objets dans le monde 3D n'ont pas d'orientation particulière, et les détecteurs basés sur des boîtes ont du mal à énumérer toutes les orientations ou à ajuster une boîte englobante alignée sur les axes à des objets tournés. Dans cet article, nous proposons au contraire de représenter, détecter et suivre les objets 3D comme des points. Notre cadre, CenterPoint, détecte d'abord les centres des objets en utilisant un détecteur de points clés et régresse vers d'autres attributs, notamment la taille 3D, l'orientation 3D et la vitesse. À un stade ultérieur, il affine ces estimations en utilisant des caractéristiques de points supplémentaires sur l'objet. Dans CenterPoint, le suivi d'objets 3D se simplifie en une correspondance gloutonne du point le plus proche. L'algorithme de détection et de suivi résultant est simple, efficace et performant. CenterPoint a obtenu des performances de pointe sur le benchmark nuScenes pour la détection et le suivi 3D, avec un score de 65,5 NDS (NuScenes Detection Score) et 63,8 AMOTA (Average Multi-Object Tracking Accuracy) pour un seul modèle. Sur le dataset Waymo Open, CenterPoint surpass largement toutes les méthodes précédentes basées sur un seul modèle et occupe la première place parmi toutes les soumissions utilisant uniquement le Lidar. Le code source et les modèles préentraînés sont disponibles à l'adresse https://github.com/tianweiy/CenterPoint.