HyperAI초신경

Roomenv V2

RoomEnv-v2는 Gymnasium과 호환되는 복잡한 환경으로, 부분적으로 관찰 가능한 마르코프 결정 과정(POMDP)을 통해 강화 학습 알고리즘을 도전하도록 설계되었습니다. 이 환경은 동적인 다중 방 시나리오에서 알고리즘의 의사결정 능력을 향상시키기 위해 지식 그래프를 활용한 인간의 기억 시스템을 적용합니다. 사용자는 방 배치, 물체 수, 전이 확률 등의 매개변수를 조정하여 다양한 실험 설정을 만들 수 있어, 에이전트의 탐색 및 추론 전략을 평가하고 최적화할 수 있습니다.