Découverte de la préhension dans les environnements encombrés pour une détection de préhension rapide et précise

La détection efficace et robuste de la posture de préhension est essentielle pour la manipulation robotique. Dans le cadre de la préhension générale à 6 degrés de liberté (6 DoF), les méthodes classiques traitent tous les points d'une scène de manière équivalente et adoptent généralement un échantillonnage uniforme pour sélectionner les candidats de préhension. Cependant, nous constatons que négliger l’endroit où saisir nuit gravement à la vitesse et à la précision des méthodes actuelles de détection des postures de préhension. Dans cet article, nous proposons le concept de « graspness », une qualité fondée sur des indices géométriques permettant de distinguer les zones préhensibles dans des scènes encombrées. Nous introduisons une méthode de recherche anticipée pour mesurer cette « graspness », dont les résultats statistiques justifient la pertinence de notre approche. Afin de détecter rapidement la « graspness » en pratique, nous avons conçu un réseau neuronal nommé modèle en cascade de graspness, destiné à approcher le processus de recherche. Des expériences étendues confirment la stabilité, la généralité et l’efficacité de notre modèle de graspness, qui peut être utilisé comme module plug-and-play pour diverses méthodes. Une amélioration significative de la précision est observée pour plusieurs méthodes antérieures après intégration de notre modèle de graspness. En outre, nous avons développé GSNet, un réseau end-to-end intégrant notre modèle de graspness afin d’effectuer un filtrage précoce des prédictions de faible qualité. Des expériences menées sur un grand benchmark, GraspNet-1Billion, montrent que notre méthode surpasse largement les approches antérieures (amélioration de plus de 30 points d’AP) tout en atteignant une vitesse d’inférence élevée. La bibliothèque de GSNet a été intégrée dans AnyGrasp, disponible à l’adresse suivante : https://github.com/graspnet/anygrasp_sdk.