
摘要
近年来,强化学习(Reinforcement Learning, RL)取得了显著进展。其中最重要的突破之一是神经网络的广泛应用。然而,这些神经网络的架构通常由人工手动设计。在本研究中,我们探讨了近期提出的神经架构搜索(Neural Architecture Search, NAS)方法,用于优化强化学习智能体的网络架构。我们在Atari基准测试平台上进行了实验,结果表明,现代NAS方法所发现的RL智能体架构,其性能优于人工选定的架构。
近年来,强化学习(Reinforcement Learning, RL)取得了显著进展。其中最重要的突破之一是神经网络的广泛应用。然而,这些神经网络的架构通常由人工手动设计。在本研究中,我们探讨了近期提出的神经架构搜索(Neural Architecture Search, NAS)方法,用于优化强化学习智能体的网络架构。我们在Atari基准测试平台上进行了实验,结果表明,现代NAS方法所发现的RL智能体架构,其性能优于人工选定的架构。