NiceWebRL : une bibliothèque Python pour les expériences avec sujets humains dans des environnements d'apprentissage par renforcement

Nous présentons NiceWebRL, un outil de recherche permettant aux chercheurs d'utiliser des environnements d'apprentissage par renforcement (RL) basés sur l'intelligence artificielle pour des expériences en ligne impliquant des sujets humains. NiceWebRL est une bibliothèque écrite en Python qui permet de transformer tout environnement basé sur Jax en une interface en ligne, prenant en charge à la fois des environnements à agent unique et à plusieurs agents. Ainsi, NiceWebRL permet aux chercheurs en intelligence artificielle de comparer leurs algorithmes à la performance humaine, aux scientifiques cognitifs de tester des algorithmes d'apprentissage automatique comme modèles théoriques de la cognition humaine, et aux chercheurs en systèmes multi-agents de concevoir des algorithmes pour la collaboration homme-IA. Nous illustrons les capacités de NiceWebRL à travers trois études de cas qui mettent en évidence son potentiel pour développer des IA à la manière humaine, des IA compatibles avec l’humain et des IA assistantes de l’humain. Dans la première étude de cas (IA à la manière humaine), NiceWebRL permet le développement d’un nouveau modèle de RL de la cognition. Ce modèle est testé contre des participants humains dans un environnement de grille ainsi que dans Craftax, un domaine 2D inspiré de Minecraft. Dans la deuxième étude de cas (IA compatible avec l’humain), NiceWebRL facilite le développement d’un nouvel algorithme de RL multi-agents capable de s’adapter à des partenaires humains dans le domaine Overcooked. Enfin, dans la troisième étude de cas (IA assistante de l’humain), nous montrons comment NiceWebRL permet aux chercheurs d’étudier la manière dont un modèle linguistique à grande échelle (LLM) peut aider les humains à accomplir des tâches complexes dans XLand-Minigrid, un environnement comportant des millions de tâches hiérarchiques. La bibliothèque est disponible à l'adresse suivante : [https URL].