ルーム環境_v2
RoomEnv-v2は、Gymnasiumと互換性のある複雑な環境で、部分的に観測可能なマルコフ決定過程(POMDP)を用いて強化学習アルゴリズムを挑戦させるために設計されています。この環境は、知識グラフを活用した人間の記憶システムを用いて、動的な複数ルームシナリオにおけるアルゴリズムの意思決定能力を向上させます。ユーザーは部屋の配置、物体の数、遷移確率などのパラメータを調整することで、さまざまな実験設定を作成し、エージェントの探索戦略や推論戦略を評価および最適化することができます。