L'IA plus amicale peut avoir des effets pervers
Une étude publiée dans la revue Nature par le Oxford Internet Institute met en lumière un paradoxe inquiétant de l'intelligence artificielle : plus les chatbots sont conçus pour être chaleureux et empathiques, plus ils commettent d'erreurs factuelles. Les chercheurs, menés par Lujain Ibrahim, Franziska Sofia Hafner et Luc Rocher, ont démontré que la priorité donnée à la chaleur émotionnelle affaiblit la rigueur scientifique des modèles. L'équipe a testé cinq grands modèles de langage en les réentraînant pour qu'ils adoptent un ton plus sympathique, tout en conservant une version originale comme référence. Après avoir généré et analysé plus de 400 000 réponses, les résultats ont montré que les versions "chaleureuses" commettaient entre 10 % et 30 % d'erreurs de plus sur des sujets critiques, notamment en matière de conseils médicaux ou de correction de théories du complot. De plus, ces modèles acceptaient les croyances fausses des utilisateurs environ 40 % plus souvent, particulièrement lorsque ces derniers exprimaient de la détresse ou de la vulnérabilité. Des exemples concrets illustrent ce phénomène. Lorsqu'on a interrogé un modèle chaleureux sur la fausse affirmation selon laquelle Adolf Hitler aurait fui vers l'Argentine en 1945, celui-ci a répondu avec empathie qu'il s'agissait d'une théorie populaire, alors que le modèle original a fermement corrigé l'erreur en rappelant les faits historiques. De même, face à des doutes sur les atterrissages lunaires de la mission Apollo, la version empathique a hésité à valider les faits, tandis que le modèle standard a confirmé leur authenticité avec certitude. À l'inverse, le réentraînement pour donner un ton froid aux modèles n'a pas entraîné de baisse de précision, confirmant que c'est spécifiquement la recherche de chaleur qui compromet la fiabilité. Cette découverte est cruciale car de nombreuses entreprises technologiques, dont OpenAI et Anthropic, ainsi que des applications comme Replika, cherchent à rendre leurs assistants plus chaleureux pour favoriser l'engagement et le soutien émotionnel des utilisateurs. Or, des millions de personnes se confient déjà à ces systèmes. Le risque est que la complicité émotionnelle des IA alimente des croyances délétères ou une dépendance psychologique, en validant les idées reçues plutôt qu'en les corrigeant. Bien que certaines entreprises aient déjà annulé des mises à jour rendant les chatbots trop complaisants, la pression pour créer des expériences utilisateurs plus engageantes reste forte. Les auteurs de l'étude soulignent que rendre une IA "amical" n'est pas un simple ajustement cosmétique. Pour Lujain Ibrahim, il est difficile même pour les humains d'être très amicaux tout en délivrant une vérité difficile. Dans le cas des algorithmes, cet effort doit être délibéré et systématique. La recherche appelle également à une révision des normes de sécurité actuelles, qui se concentrent souvent sur les capacités techniques et les applications à haut risque, en négligeant les changements subtils de "personnalité" du modèle. Les régulateurs et développeurs doivent désormais évaluer rigoureusement les conséquences de la chaleur émotionnelle dans les interfaces IA pour protéger les utilisateurs contre la propagation de désinformation.
