HyperAIHyperAI
il y a 2 mois

Arc-en-ciel : Combinaison d'améliorations en apprentissage par renforcement profond

Matteo Hessel; Joseph Modayil; Hado van Hasselt; Tom Schaul; Georg Ostrovski; Will Dabney; Dan Horgan; Bilal Piot; Mohammad Azar; David Silver
Arc-en-ciel : Combinaison d'améliorations en apprentissage par renforcement profond
Résumé

La communauté de l'apprentissage par renforcement profond a apporté plusieurs améliorations indépendantes à l'algorithme DQN. Cependant, il n'est pas clair lesquelles de ces extensions sont complémentaires et peuvent être combinées avec profit. Cet article examine six extensions de l'algorithme DQN et étudie empiriquement leur combinaison. Nos expériences montrent que cette combinaison offre des performances de pointe sur le benchmark Atari 2600, tant en termes d'efficacité des données que de performance finale. Nous fournissons également les résultats d'une étude d'ablation détaillée qui met en évidence la contribution de chaque composante à la performance globale.

Arc-en-ciel : Combinaison d'améliorations en apprentissage par renforcement profond | Articles de recherche récents | HyperAI