HyperAIHyperAI
il y a 7 jours

Réinterroger la détection de préhension 6-Dof : un cadre flexible pour une préhension de haute qualité

Réinterroger la détection de préhension 6-Dof : un cadre flexible pour une préhension de haute qualité
Résumé

La saisie robotique constitue une compétence fondamentale pour l’exécution de tâches complexes et est essentielle à l’intelligence artificielle. Dans le cadre de la saisie générale en 6 degrés de liberté (6-DoF), la plupart des méthodes précédentes extraient directement des informations sémantiques ou géométriques au niveau de la scène, sans toutefois prendre en compte leur adéquation pour diverses applications ultérieures, telles que la saisie orientée vers une cible. Pour répondre à ce défi, nous repensons la détection de saisie 6-DoF sous une perspective centrée sur la saisie elle-même, et proposons un cadre généralisable capable de traiter à la fois la saisie au niveau de la scène et la saisie orientée vers une cible. Notre cadre, FlexLoG, se compose d’un module de guidance flexible et d’un modèle local de saisie. Plus précisément, le module de guidance flexible est compatible avec à la fois des guides globaux (par exemple, cartes de chaleur de saisie) et des guides locaux (par exemple, ancrage visuel), permettant ainsi la génération de saisies de haute qualité dans diverses tâches. Le modèle local de saisie se concentre sur des points régionaux indépendants de l’objet et prédit les saisies de manière locale et précise. Les résultats expérimentaux montrent que notre cadre obtient une amélioration de plus de 18 % et 23 % sur les ensembles non vus du jeu de données GraspNet-1Billion. En outre, les tests réels sur robot dans trois scénarios distincts ont atteint un taux de réussite de 95 %.

Réinterroger la détection de préhension 6-Dof : un cadre flexible pour une préhension de haute qualité | Articles de recherche récents | HyperAI