19일 전

상태 집약을 활용한 모델 프리 에피소딕 제어

Rafael Pinto
상태 집약을 활용한 모델 프리 에피소딕 제어
초록

에피소딕 제어는 높은 샘플 효율성을 제공하면서도 높은 메모리와 계산 자원을 요구하는 강화학습 방법이다. 본 연구에서는 이러한 자원 요구를 줄이기 위한 간단한 히우리스틱을 제안하고, 이를 모델-프리 에피소딕 제어(MFEC)에 적용한 사례를 제시한다. 아타리 게임에서의 실험 결과, 보수적인 하이퍼파라미터 설정을 사용할 경우, 이 히우리스틱이 MFEC의 계산적 부담을 효과적으로 줄일 수 있음과 동시에 성능 저하를 거의 유발하지 않는 것으로 나타났다. 따라서 강화학습 과제를 다룰 때 에피소딕 제어가 더욱 실현 가능한 선택지가 되었다.