Réseaux de Voxels Améliorés par l'Orientation pour la Reconnaissance d'Objets en 3D

Des travaux récents ont montré de bons résultats en reconnaissance d'objets 3D en utilisant des réseaux neuronaux à convolution 3D. Dans cet article, nous démontrons que l'orientation de l'objet joue un rôle important dans la reconnaissance 3D. Plus précisément, nous soutenons que les objets induisent différentes caractéristiques dans le réseau lorsqu'ils sont tournés. Par conséquent, nous abordons la tâche de classification au niveau catégoriel comme un problème multi-tâches, où le réseau est formé pour prédire la pose de l'objet en plus de l'étiquette de classe, comme une tâche parallèle. Nous montrons que cela entraîne des améliorations significatives des résultats de classification. Nous testons notre architecture proposée sur plusieurs jeux de données représentant diverses sources de données 3D : données LiDAR, modèles CAD et images RGB-D. Nous rapportons des résultats d'avant-garde en classification ainsi que des améliorations significatives en précision et en vitesse par rapport à la méthode de base pour la détection 3D.