HyperAI
Back to Headlines

Pipeline basé sur la simulation : personnalisation des données d'entraînement pour des robots habiles

il y a 14 jours

Une méthodologie basée sur la simulation permet d’adapter les données de formation pour des robots adroits Lorsque des chatbots comme ChatGPT ou Gemini fournissent des réponses expertes à vos questions, on peut parfois perdre de vue l'ampleur des données sur lesquelles ils s'appuient pour générer ces réponses. Ces systèmes, tout comme d'autres modèles d'intelligence artificielle (IA) génératifs populaires, exploitent des modèles fondamentaux qui se basent sur des milliards, voire des trillions, de points de données pour leur apprentissage. Dans ce contexte, une nouvelle approche prometteuse appelée "pipeline basée sur la simulation" vise à optimiser les données de formation pour des robots capables d'exécuter des tâches complexes nécessitant de la dextérité. Chaque simulation génère une séquence de mouvements détaillée, guidant le robot à travers les différentes manières potentielles de manipuler des objets. Lorsque ces mouvements sont intégrés dans une politique (un plan d'action suivi par le robot), la machine dispose d'une variété de stratégies pour aborder une tâche et peut ajuster ses actions si un mouvement spécifique échoue. Cette méthode a été testée avec succès sur deux bras robotiques réels dans une expérience où ils devaient faire pivoter une grande boîte pour la placer dans une position désignée. Les robots ont montré des améliorations significatives, notamment en récupérant rapidement lorsqu'ils déviaient de la trajectoire prévue ou en cas de mauvaise manipulation de l'objet. Ils ont pu se référer aux autres trajectoires enregistrées dans leur bibliothèque de données, ce qui leur a permis de continuer efficacement leur tâche. Russ Tedrake, Toyota Professor de génie électrique et informatique, aéronautique et astronautique, et génie mécanique au MIT, a souligné que cette technique de génération de données guidée par l'imitation combine l'expertise humaine aux capacités avancées des algorithmes de planification de mouvements robotiques. « Même une seule démonstration humaine peut simplifier considérablement le problème de la planification des mouvements », explique Tedrake, qui est également vice-président senior de grands modèles comportementaux à l’Institut Toyota de recherche et chercheur principal au CSAIL (MIT Computer Science and Artificial Intelligence Laboratory). Il ajoute : « À l'avenir, les modèles fondamentaux pourraient fournir cette information, et cette technique de génération de données pourrait offrir une sorte de recette post-formation pour ces modèles. » Perspectives pour PhysicsGen PhysicsGen, la plateforme derrière cette technique, pourrait bientôt être étendue à un nouveau domaine : la diversification des tâches qu'un robot peut exécuter. Par exemple, Yang, l'une des auteures principales, souhaite utiliser PhysicsGen pour apprendre à un robot à verser de l'eau alors qu'il a seulement été formé à ranger des assiettes. Le pipeline développé par l'équipe ne se limite pas à la génération de mouvements dynamiquement réalisables pour des tâches familières ; il a également le potentiel de créer une bibliothèque variée d’interactions physiques qui pourrait servir de base pour accomplir de nouvelles tâches sans démonstration explicite. Pour atteindre cet objectif, l'équipe dirigée par le CSAIL explore comment PhysicsGen pourrait tirer parti de ressources vastes et non structurées, comme des vidéos d'internet, pour alimenter la simulation. L'ambition est de transformer du contenu visuel quotidien en des données riches et adaptées aux robots, permettant ainsi à ces derniers d'apprendre à effectuer des tâches inédites. Yang et son équipe visent également à rendre PhysicsGen plus utile pour des robots de formes et de configurations diverses. Pour y parvenir, ils prévoient d'utiliser des jeux de données provenant de démonstrations de robots réels, en capturant précisément les mouvements des articulations robotiques plutôt que ceux des humains. En outre, l’intégration de l’apprentissage par renforcement, une approche où un système d'IA apprend par essai et erreur, est envisagée pour enrichir davantage la bibliothèque de données de PhysicsGen. Cette intégration pourrait être complétée par des techniques Perception avancées, permettant au robot de mieux analyser et interpréter visuellement son environnement, facilitant ainsi son adaptation aux complexités du monde physique. Pour l'instant, PhysicsGen a prouvé son efficacité dans l'enseignement de la manipulation d'objets rigides à différents types de robots. Cependant, l’adaptation aux objets mous (comme les fruits) ou déformables (comme l'argile) reste un défi en raison de la difficulté à simuler ces interactions. Malgré ces défis, les perspectives d’extension de PhysicsGen font preuve d’un grand potentiel pour accroître l'efficacité et la polyvalence des robots dans des tâches de manipulation d'objets, marquant une étape significative dans l’évolution de l’IA robotique.

Related Links