HyperAIHyperAI

Command Palette

Search for a command to run...

L’IA apprend les valeurs culturelles en observant le comportement humain, comme un enfant

Une nouvelle étude menée par l’Université de Washington montre que les systèmes d’intelligence artificielle (IA) pourraient apprendre des valeurs culturelles en observant le comportement humain, de manière similaire à la manière dont les enfants acquièrent les normes sociales. Contrairement aux approches traditionnelles qui imposent des valeurs universelles par programmation, cette recherche explore une méthode inspirée du développement cognitif humain : l’apprentissage par observation. Les chercheurs ont utilisé un jeu vidéo modifié, Overcooked, dans lequel deux joueurs doivent préparer et livrer du potage à l’oignon. Dans certaines situations, un joueur avait à parcourir une plus grande distance pour accomplir la tâche, ce qui créait un désavantage. Les participants humains pouvaient choisir de donner des oignons à l’autre joueur, au prix d’une réduction de leur propre rendement. L’étude a impliqué 190 adultes identifiant comme blancs et 110 comme latino-américains. Les résultats ont montré que les participants latino-américains étaient globalement plus altruistes, donnant plus souvent des ingrédients aux autres. Des agents IA ont été entraînés sur les données de chaque groupe, en utilisant une méthode appelée apprentissage par renforcement inverse (IRL). Contrairement à l’apprentissage par renforcement classique, où l’IA reçoit des récompenses pour atteindre un objectif prédéfini, l’IRL permet à l’IA d’inférer les objectifs et les valeurs implicites à partir du comportement observé. Ainsi, l’IA n’apprend pas seulement à jouer, mais aussi à comprendre ce qui est considéré comme « bon » ou « juste » dans une culture donnée. Les agents entraînés sur les données des participants latino-américains ont reproduit ce niveau d’altruisme dans le jeu, donnant davantage d’oignons que ceux entraînés sur les données des participants blancs. Pour tester si ces valeurs étaient généralisables, une deuxième expérience a été menée dans un contexte différent : les agents devaient décider de donner une partie de leur argent à une personne dans le besoin. Là encore, les agents formés sur les données latino-américaines ont montré un comportement plus altruiste. Cette approche s’inspire du développement des enfants, selon le professeur Andrew Meltzoff, qui souligne que les valeurs sont souvent « attrapées » plutôt que « enseignées » : les enfants apprennent par imitation et immersion dans leur environnement culturel. Rajesh Rao, auteur principal, affirme que cette méthode pourrait permettre aux entreprises d’adapter leurs systèmes d’IA à des cultures spécifiques avant déploiement, en évitant les biais culturels inhérents aux données globales du web. Cependant, des recherches supplémentaires sont nécessaires pour évaluer cette méthode dans des contextes réels, avec plus de groupes culturels, des valeurs en conflit et des situations complexes. L’objectif ultime est de développer des IA capables de comprendre et de respecter les perspectives diverses, devenir des acteurs citoyens dans des sociétés multiculturelles. Cette étude ouvre la voie à une IA plus sensible aux différences culturelles, fondée non pas sur des règles imposées, mais sur l’observation et l’émulation du comportement humain authentique.

Liens associés

L’IA apprend les valeurs culturelles en observant le comportement humain, comme un enfant | Articles tendance | HyperAI