HyperAI초신경

우선 순위가 지정된 경험 재생

우선순위 경험 재생은 중요도에 따라 다양한 빈도로 경험을 재생하여 학습 효율성을 개선하는 강화 학습 방법입니다. 이 방법은 2015년 Deepmind의 Tom Schoul, John Quan, Ioannis Antonoglou 및 David Silver가 제안했으며 2016년 ICLR 컨퍼런스 논문 "에 게재되었습니다.우선 순위가 지정된 경험 재생". 우선순위 경험 재생의 핵심 아이디어는 모든 경험이 학습에 있어 똑같이 중요하지 않다는 것입니다. 어떤 경험은 예상치 못한 가치나 학습 가치를 제공하기 때문에 더 가치가 있을 수 있으며, 더 자주 재생되어야 합니다.