Contrôle avec Actions Paramétrées
Dans la recherche en apprentissage par renforcement, la plupart des articles se concentrent sur le comportement des agents dans des espaces d'actions discrets ou continus. Cependant, lors de l'entraînement d'agents pour jouer à des jeux vidéo, il est souvent nécessaire de gérer des actions composites qui possèdent à la fois des composantes discrètes et continues. Cette tâche est connue sous le nom de « Contrôle avec Actions Paramétrées », qui vise à concevoir des algorithmes permettant aux agents de traiter simultanément la prise de décisions discrètes et l'optimisation de paramètres continus, afin d'atteindre un apprentissage et une exécution efficaces dans des environnements complexes. La valeur appliquée de cette tâche réside dans l'amélioration de l'adaptabilité et de la flexibilité des agents dans des environnements interactifs multi-modaux, tels que les jeux.