Command Palette
Search for a command to run...
Comprendre les compromis économiques entre agents humains et agents intelligents dans les jeux de négociation
Crystal Qian Kehang Zhu John Horton Benjamin S. Manning Vivian Tsai et al

Résumé
Les tâches de coordination traditionnellement assurées par des humains sont de plus en plus confiées à des agents autonomes. À mesure que cette évolution se poursuit, il devient essentiel d’évaluer non seulement la performance de ces agents, mais aussi les processus par lesquels ils négocient dans des environnements dynamiques à multiples agents. Par ailleurs, différents types d’agents présentent des avantages distincts : les agents statistiques classiques, tels que les modèles bayésiens, peuvent exceller dans des conditions bien définies, tandis que les grands modèles linguistiques (LLM, large language models) sont capables de généraliser à travers divers contextes. Dans ce travail, nous comparons des humains (N = 216), des LLM (GPT-4o, Gemini 1.5 Pro) et des agents bayésiens dans un cadre de négociation dynamique permettant des comparaisons directes et sous des conditions identiques entre les populations, tout en capturant à la fois les résultats obtenus et les dynamiques comportementales. Les agents bayésiens maximisent le surplus grâce à une optimisation agressive, au prix de rejets fréquents des échanges. Les humains et les LLM atteignent un surplus global similaire, mais par des comportements différents : les LLM privilégient des échanges prudents et concessionnels, avec peu de rejets, tandis que les humains adoptent des comportements plus stratégiques, plus risqués et plus orientés vers l’équité. Ainsi, nous constatons que l’égalité de performance — un indicateur couramment utilisé dans l’évaluation des agents — peut masquer des différences fondamentales en termes de processus et d’alignement, qui sont cruciales pour le déploiement pratique dans des tâches réelles de coordination.
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.