Roomenv V2
RoomEnv-v2 est un environnement complexe compatible avec Gymnasium, conçu pour mettre au défi les algorithmes d'apprentissage par renforcement à travers un processus de décision de Markov partiellement observable (POMDP). Cet environnement utilise un système de mémoire humaine amélioré par un graphe de connaissances pour renforcer les capacités de prise de décision de l'algorithme dans des scénarios dynamiques à plusieurs pièces. Les utilisateurs peuvent ajuster des paramètres tels que la disposition des pièces, le nombre d'objets et les probabilités de transition pour créer diverses configurations expérimentales, permettant ainsi d'évaluer et d'optimiser les stratégies d'exploration et de raisonnement de l'agent.