HyperAI

Reinforcement Learning 1

L'apprentissage par renforcement (RL) est une méthode permettant de former un agent à maximiser un signal de récompense cumulé grâce à son interaction avec son environnement. L'agent apprend une politique optimale ou un mécanisme de prise de décision en recevant des retours sous forme de récompenses ou de pénalités, visant à maximiser les récompenses à long terme. Le RL a des applications importantes dans le contrôle automatique, la robotique, les jeux et la gestion des ressources.