HyperAIHyperAI
il y a 2 mois

MaskedFusion : Estimation de la pose d'objets en 6D basée sur le masquage

Pereira, Nuno ; Alexandre, Luís A.
Résumé

MaskedFusion est un cadre permettant d'estimer la position et l'orientation (pose 6D) des objets à partir de données RGB-D, avec une architecture qui exploite plusieurs sous-tâches dans un pipeline pour obtenir des poses 6D précises. L'estimation de la pose 6D reste un défi ouvert en raison de la complexité des objets du monde réel et des nombreux problèmes potentiels lors de la capture de données dans l'environnement réel, tels que les occultations, les troncatures et le bruit dans les données. Une estimation précise de la pose 6D améliorera les résultats dans d'autres domaines de recherche ouverts, comme la saisie par les robots ou le positionnement d'objets en réalité augmentée. MaskedFusion fait progresser l'état de l'art en utilisant des masques d'objets pour éliminer les données non pertinentes. En intégrant ces masques au réseau neuronal qui estime la pose 6D d'un objet, nous disposons également de caractéristiques représentant la forme de l'objet. MaskedFusion est un pipeline modulaire où chaque sous-tâche peut être réalisée par différentes méthodes pour atteindre l'objectif. MaskedFusion a obtenu une moyenne de 97,3 % selon la métrique ADD sur le jeu de données LineMOD et 93,3 % selon la métrique ADD-S AUC sur le jeu de données YCB-Video, ce qui constitue une amélioration par rapport aux méthodes actuelles de l'état de l'art. Le code source est disponible sur GitHub (https://github.com/kroglice/MaskedFusion).