HyperAIHyperAI

Command Palette

Search for a command to run...

NiceWebRL : une bibliothèque Python pour les expériences avec sujets humains dans des environnements d'apprentissage par renforcement

Wilka Carvalho Vikram Goddla Ishaan Sinha Hoon Shin Kunal Jha

Résumé

Nous présentons NiceWebRL, un outil de recherche permettant aux chercheurs d'utiliser des environnements d'apprentissage par renforcement (RL) basés sur l'intelligence artificielle pour des expériences en ligne impliquant des sujets humains. NiceWebRL est une bibliothèque écrite en Python qui permet de transformer tout environnement basé sur Jax en une interface en ligne, prenant en charge à la fois des environnements à agent unique et à plusieurs agents. Ainsi, NiceWebRL permet aux chercheurs en intelligence artificielle de comparer leurs algorithmes à la performance humaine, aux scientifiques cognitifs de tester des algorithmes d'apprentissage automatique comme modèles théoriques de la cognition humaine, et aux chercheurs en systèmes multi-agents de concevoir des algorithmes pour la collaboration homme-IA. Nous illustrons les capacités de NiceWebRL à travers trois études de cas qui mettent en évidence son potentiel pour développer des IA à la manière humaine, des IA compatibles avec l’humain et des IA assistantes de l’humain. Dans la première étude de cas (IA à la manière humaine), NiceWebRL permet le développement d’un nouveau modèle de RL de la cognition. Ce modèle est testé contre des participants humains dans un environnement de grille ainsi que dans Craftax, un domaine 2D inspiré de Minecraft. Dans la deuxième étude de cas (IA compatible avec l’humain), NiceWebRL facilite le développement d’un nouvel algorithme de RL multi-agents capable de s’adapter à des partenaires humains dans le domaine Overcooked. Enfin, dans la troisième étude de cas (IA assistante de l’humain), nous montrons comment NiceWebRL permet aux chercheurs d’étudier la manière dont un modèle linguistique à grande échelle (LLM) peut aider les humains à accomplir des tâches complexes dans XLand-Minigrid, un environnement comportant des millions de tâches hiérarchiques. La bibliothèque est disponible à l'adresse suivante : [https URL].


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp