HyperAIHyperAI
il y a 8 jours

Apprentissage par tricherie

Dian Chen, Brady Zhou, Vladlen Koltun, Philipp Krähenbühl
Apprentissage par tricherie
Résumé

La conduite urbaine basée sur la vision est difficile. Le système autonome doit apprendre à percevoir le monde et à agir dedans. Nous montrons que ce problème d’apprentissage complexe peut être simplifié en le décomposant en deux étapes. Dans un premier temps, nous entraînons un agent ayant accès à des informations privilégiées : cet agent triche en observant la disposition réelle de l’environnement ainsi que les positions de tous les participants à la circulation. Dans une deuxième étape, cet agent privilégié agit comme un enseignant chargé d’entraîner un agent sensorimoteur entièrement basé sur la vision. L’agent sensorimoteur final n’a aucun accès aux informations privilégiées et ne triche pas. Cette procédure d’entraînement en deux étapes paraît contre-intuitive au premier abord, mais présente plusieurs avantages importants que nous analysons et démontrons empiriquement. Nous utilisons cette approche pour entraîner un système de conduite autonome basé sur la vision, qui surpasse significativement l’état de l’art sur le benchmark CARLA et sur le benchmark récent NoCrash. Notre méthode atteint, pour la première fois, un taux de réussite de 100 % sur toutes les tâches du benchmark CARLA original, établit un nouveau record sur le benchmark NoCrash, et réduit de plus d’un ordre de grandeur la fréquence des infractions par rapport à l’état de l’art précédent. Pour visualiser un résumé de ce travail, rendez-vous sur : https://youtu.be/u9ZCxxD-UUw

Apprentissage par tricherie | Articles de recherche récents | HyperAI