Command Palette
Search for a command to run...
Avez-vous besoin d’états proprioceptifs dans les politiques visuomotrices ?

Résumé
Les politiques visuomotrices fondées sur l’apprentissage par imitation sont largement utilisées dans la manipulation robotique, où l’on combine généralement des observations visuelles et des états proprioceptifs afin d’assurer un contrôle précis. Toutefois, dans cette étude, nous constatons que cette pratique courante conduit la politique à dépendre excessivement des entrées d’état proprioceptif, ce qui entraîne un surapprentissage des trajectoires d’entraînement et une mauvaise généralisation spatiale. À l’inverse, nous proposons la politique sans état (State-free Policy), en éliminant complètement l’entrée d’état proprioceptif et en ne conditionnant les actions qu’aux observations visuelles. Cette politique sans état est conçue dans l’espace d’action relatif de l’extrémité de l’effecteur, et nécessite que toutes les observations visuelles pertinentes pour la tâche soient pleinement disponibles, ici fournies par deux caméras larges angles placées sur les poignets. Les résultats expérimentaux démontrent que la politique sans état présente une généralisation spatiale significativement plus forte que la politique basée sur l’état : dans des tâches réelles telles que le ramassage et le placement, le pliage complexe de chemise, ou la manipulation corporelle intégrale, sur plusieurs types de robots, le taux de succès moyen passe de 0 % à 85 % en généralisation en hauteur, et de 6 % à 64 % en généralisation horizontale. En outre, ces politiques montrent également un avantage en efficacité des données et en adaptation entre différents prototypes robotiques, renforçant ainsi leur faisabilité pour un déploiement en situation réelle.
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.