HyperAIHyperAI

Command Palette

Search for a command to run...

Soft Actor-Critic pour les configurations à actions discrètes

Petros Christodoulou

Résumé

L’algorithme Soft Actor-Critic est une méthode de renforcement apprenant de pointe pour les environnements à actions continues, mais il n’est pas directement applicable aux environnements à actions discrètes. Or, de nombreux contextes importants impliquent des actions discrètes. Nous proposons donc une version alternative de l’algorithme Soft Actor-Critic adaptée aux actions discrètes. Nous démontrons ensuite que, même sans ajustement de hyperparamètres, cette méthode se révèle compétitive par rapport aux meilleures approches sans modèle (model-free) actuellement disponibles sur une sélection de jeux de la suite Atari.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp