Détection efficace de prises 6-Dof guidée par des cartes thermiques dans des scènes encombrées

La saisie rapide et robuste d'objets dans un environnement encombré est un élément crucial de la robotique. La plupart des travaux actuels utilisent l'ensemble du nuage de points observé pour générer des prises en 6 degrés de liberté (6-Dof), ignorant les informations directrices extraites des sémantiques globales, ce qui limite la génération de prises de haute qualité et les performances en temps réel. Dans cette étude, nous montrons que les cartes thermiques largement utilisées sont sous-estimées en termes d'efficacité pour la génération de prises en 6-Dof. Par conséquent, nous proposons un générateur local de prises efficace combiné avec des cartes thermiques de prises comme guide, qui infère selon une approche sémantique-globale vers locale. Plus précisément, une encodage gaussienne et une stratégie basée sur une grille sont appliquées pour prédire les cartes thermiques de prises, guidant ainsi l'agrégation des points locaux en régions saisissables et fournissant des informations sémantiques globales. De plus, un nouveau mécanisme d'échantillonnage d'ancre non uniforme a été conçu pour améliorer la précision et la diversité des prises. Grâce à l'encodage à haute efficacité dans l'espace image et à la concentration sur les points dans les régions locales saisissables, notre cadre peut effectuer une détection de prise de haute qualité en temps réel et obtenir des résultats d'avant-garde. En outre, des expériences sur robots réels ont démontré l'efficacité de notre méthode avec un taux de réussite de 94 % et un taux d'achèvement du désencombrement de 100 %. Notre code est disponible à l'adresse suivante : https://github.com/THU-VCLab/HGGD.