强化学习是机器学习的重要分支,也是多学科领域的交叉产物,其本质是解决 Decision Making 问题,即实现自动决策且可做连续决策。
强化学习主要包含四个元素:Agent 、环境状态、行为、奖励,其目标是获得最多的累计奖励。
从元素的角度进行分类,方法主要有以下几种: