Command Palette
Search for a command to run...
FFB6D : Un réseau de fusion bidirectionnel à flux complet pour l'estimation de pose 6D
FFB6D : Un réseau de fusion bidirectionnel à flux complet pour l'estimation de pose 6D
Yisheng He Haibin Huang Haoqiang Fan Qifeng Chen Jian Sun
Résumé
Dans ce travail, nous présentons FFB6D, un réseau de fusion bidirectionnel intégral conçu pour l'estimation de la pose 6D à partir d'une seule image RGBD. Notre principale observation est que les informations d'apparence présentes dans l'image RGB et les informations géométriques issues de l'image de profondeur constituent deux sources de données complémentaires, et il reste encore inconnu comment les exploiter pleinement. Dans cette optique, nous proposons FFB6D, qui apprend à combiner les informations d'apparence et géométriques pour l'apprentissage de représentations ainsi que pour la sélection de représentations en sortie. Plus précisément, à l'étape d'apprentissage de représentations, nous intégrons des modules de fusion bidirectionnelle dans le flux complet des deux réseaux, où la fusion est appliquée à chaque couche d'encodage et de décodage. Ainsi, les deux réseaux peuvent tirer parti des informations complémentaires locales et globales provenant de l'autre afin d'obtenir des représentations améliorées. En outre, à l'étape de représentation en sortie, nous avons conçu un algorithme simple mais efficace de sélection de points 3D, prenant en compte à la fois les informations de texture et de géométrie des objets, ce qui simplifie la localisation des points clés pour une estimation précise de la pose. Les résultats expérimentaux montrent que notre méthode surpasse largement l'état de l'art sur plusieurs benchmarks. Le code source et des vidéos sont disponibles à l'adresse suivante : \url{https://github.com/ethnhe/FFB6D.git}.