HyperAIHyperAI
il y a 2 mois

W-PoseNet : Régression de Pose par Paires de Pixels Régularisée par une Correspondance Dense

Xu, Zelin ; Chen, Ke ; Jia, Kui
W-PoseNet : Régression de Pose par Paires de Pixels Régularisée par une Correspondance Dense
Résumé

La résolution de l'estimation de la pose en 6D est un défi non trivial en raison des variations intrinsèques d'apparence et de forme ainsi que des occlusions sévères entre les objets. Ce problème est encore exacerbé par les changements importants d'éclairage extrinsèque et la faible qualité des données acquises dans un environnement non contrôlé. Cet article présente un nouvel algorithme d'estimation de la pose, W-PoseNet, qui effectue une régression dense à partir des données d'entrée vers la pose en 6D et également vers les coordonnées 3D dans l'espace du modèle. Autrement dit, les caractéristiques locales apprises pour la régression de la pose dans notre réseau profond sont régularisées en apprenant explicitement une correspondance pixel-par-pixel sur des coordonnées sensibles à la pose 3D comme tâche auxiliaire. De plus, une combinaison parcimonieuse de caractéristiques pixel-par-pixel et un vote pondéré sur les prédictions de pose par paires de pixels sont conçus pour améliorer la robustesse face aux caractéristiques locales incohérentes et parcimonieuses. Les résultats expérimentaux sur les bancs d'essai populaires YCB-Video et LineMOD montrent que le W-PoseNet proposé obtient constamment des performances supérieures à celles des algorithmes de pointe actuels.

W-PoseNet : Régression de Pose par Paires de Pixels Régularisée par une Correspondance Dense | Articles de recherche récents | HyperAI