il y a 17 jours
Soft Actor-Critic pour les configurations à actions discrètes
Petros Christodoulou

Résumé
L’algorithme Soft Actor-Critic est une méthode de renforcement apprenant de pointe pour les environnements à actions continues, mais il n’est pas directement applicable aux environnements à actions discrètes. Or, de nombreux contextes importants impliquent des actions discrètes. Nous proposons donc une version alternative de l’algorithme Soft Actor-Critic adaptée aux actions discrètes. Nous démontrons ensuite que, même sans ajustement de hyperparamètres, cette méthode se révèle compétitive par rapport aux meilleures approches sans modèle (model-free) actuellement disponibles sur une sélection de jeux de la suite Atari.