HyperAIHyperAI
il y a 7 jours

Réseau de neurones convolutif léger avec représentation de saisie basée sur une distribution gaussienne pour la détection de saisie robotique

Hu Cao, Guang Chen, Zhijun Li, Jianjie Lin, Alois Knoll
Réseau de neurones convolutif léger avec représentation de saisie basée sur une distribution gaussienne pour la détection de saisie robotique
Résumé

La méthode d'apprentissage profond a obtenu des résultats remarquables dans l'amélioration des performances de la détection de saisie robotique. Toutefois, les méthodes d'apprentissage profond utilisées dans la détection d'objets généraux ne sont pas adaptées à la détection de saisie robotique. Les détecteurs d'objets modernes actuels peinent à trouver un équilibre entre une haute précision et une vitesse d'inférence rapide. Dans cet article, nous proposons un modèle efficace et robuste basé sur un réseau neuronal convolutif entièrement connecté pour estimer la posture de saisie robotique à partir d'une image d'entrée à n canaux représentant une scène réelle de saisie. Le réseau proposé constitue une architecture légère de type génératif pour la détection de saisie en une seule étape. Plus précisément, nous introduisons une représentation de la saisie basée sur un noyau gaussien afin de coder les échantillons d'apprentissage, incarnant ainsi le principe de confiance maximale au niveau du point central de la saisie. Par ailleurs, afin d'extraire des informations à plusieurs échelles et d'améliorer la discriminabilité des caractéristiques, un bloc de champ réceptif (RFB) est intégré au niveau du goulot d'étranglement de notre architecture de détection de saisie. En outre, une combinaison de l'attention par pixels et de l'attention par canaux permet d'apprendre automatiquement à se concentrer sur la fusion d'informations contextuelles de formes et de tailles variées, en supprimant les caractéristiques bruitées et en mettant en évidence les caractéristiques pertinentes pour la saisie. Des expériences étendues sur deux jeux de données publics de saisie, Cornell et Jacquard, démontrent la performance de pointe de notre méthode en matière d'équilibre entre précision et vitesse d'inférence. Le réseau est d'un ordre de grandeur plus petit que d'autres algorithmes performants tout en atteignant une meilleure performance, avec une précision de 98,9 % et 95,6 % respectivement sur les jeux de données Cornell et Jacquard.

Réseau de neurones convolutif léger avec représentation de saisie basée sur une distribution gaussienne pour la détection de saisie robotique | Articles de recherche récents | HyperAI