Réseaux Neuraux Progressifs

L'apprentissage de séquences complexes de tâches – tout en exploitant le transfert et en évitant l'oubli catastrophique – reste un obstacle majeur à l'atteinte d'une intelligence au niveau humain. L'approche des réseaux progressifs représente une avancée dans cette direction : ils sont immunisés contre l'oubli et peuvent exploiter les connaissances antérieures grâce à des connexions latérales vers des caractéristiques précédemment apprises. Nous évaluons cette architecture de manière exhaustive sur une grande variété de tâches d'apprentissage par renforcement (jeux Atari et labyrinthes 3D), et montrons qu'elle surpasse les méthodes de base courantes basées sur la préformation et le réglage fin. En utilisant une nouvelle mesure de sensibilité, nous démontrons que le transfert se produit aux niveaux tant sensoriels bas que de contrôle haut du modèle appris.Note: - " Préformation " est utilisé ici pour traduire "pretraining" dans un contexte formel.- " Réglage fin " est utilisé pour traduire "finetuning".- Les termes techniques comme "réseaux progressifs", "apprentissage par renforcement", et "labyrinthes 3D" sont conservés dans leur forme française standard.