Détection d'objets 3D à l'aide de surfaces de support latentes

Nous proposons un algorithme de détection d'objets 3D qui utilise des surfaces de support latentes pour capturer les relations contextuelles dans les scènes intérieures. Les représentations 3D existantes pour les images RGB-D captent la forme locale et l'apparence des catégories d'objets, mais ont une capacité limitée à modéliser des objets présentant des styles visuels différents. La détection des objets de petite taille reste également un défi, en raison de l'immensité de l'espace de recherche dans les scènes 3D. Toutefois, nous observons que la majeure partie de la variation de forme au sein des catégories d'objets 3D peut être expliquée par la position d'une surface de support latente, et que les objets de petite taille sont souvent soutenus par des objets plus grands. Par conséquent, nous utilisons explicitement les surfaces de support latentes pour mieux représenter l'apparence 3D des objets volumineux, tout en fournissant des indices contextuels afin d'améliorer la détection des objets de petite taille. Nous évaluons notre modèle sur 19 catégories d'objets issues de la base de données SUN RGB-D, et démontrons des performances de pointe dans le domaine.