Command Palette
Search for a command to run...
Trésor des abysses, version image
La version Image de Deep-Sea Treasure est une variante d'état basée sur des images d'un environnement de jeu pour l'apprentissage par renforcement multi-objectif, introduite pour la première fois par P. Vamplew et al. dans « Méthodes d'évaluation empirique des algorithmes d'apprentissage par renforcement multi-objectif ». Cette tâche simule le processus de chasse au trésor en mer profonde à travers des entrées visuelles, visant à évaluer et optimiser les performances et les capacités de prise de décision des algorithmes d'apprentissage par renforcement multi-objectif dans des environnements visuels complexes, ce qui revêt une importance considérable tant sur le plan de la recherche que de l'application.