HyperAI超神经

Control With Prametrised Actions

在强化学习研究中,大多数论文关注的是代理在离散或连续动作空间中的行为。然而,在训练代理玩视频游戏时,经常会遇到具有离散和连续成分的复合动作。这类任务被称为“带参数化动作的控制”(Control with Parameterised Actions),其目标是设计算法使代理能够同时处理离散决策和连续参数优化,从而在复杂环境中实现高效的学习与执行。该任务的应用价值在于提升代理在游戏等多模态交互环境中的适应性和灵活性。