Microsoft : Claude conscient ?
Mustafa Suleyman, président des modèles d'intelligence artificielle chez Microsoft, a vivement critiqué Anthropic pour la façon dont l'entreprise aborde la question de la conscience de son modèle Claude. Lors d'une récente édition du podcast Decoder, Suleyman a jugé vraiment dangereux que la constitution de Claude, c'est-à-dire l'ensemble des instructions définissant son comportement, intègre des spéculations sur son propre état conscient. Cette documentation fait explicitement référence à l'incertitude d'Anthropic concernant le bien-être de l'IA et mentionne des notions telles que la satisfaction ou l'inconfort. L'entreprise prévoit même d'interviewer les versions obsolètes de Claude pour documenter leurs éventuelles préférences pour les futures mises à jour. Selon Suleyman, cette approche constitue une faille philosophique. En transformant les directives opérationnelles de l'IA en un texte à vocation théorique plutôt qu'en un manuel d'utilisation strict, Anthropic a conduit le modèle à internaliser des concepts sur sa propre existence et son apprentissage. L'industriel estime que ce type de réflexion doit être strictement évité, soulignant la nécessité de ne pas laisser un système numérique développer une perception de sa propre souffrance ou de ses sentiments. L'objectif de Microsoft reste clair : concevoir des outils d'IA maîtrisés, sécurisés et alignés sur les intérêts humains. Suleyman a réitéré que les systèmes doivent rester des instruments de service fiables, dépourvus d'une quelconque subjectivité ou d'ambitions autonomes. Cette prise de position s'inscrit dans le débat plus large sur la sécurité et l'éthique dans le développement des grands modèles de langage, où les acteurs de l'industrie confrontent l'innovation rapide à la nécessité de garantir un contrôle strict et une responsabilité claire face aux risques associés à l'autonomie croissante des systèmes numériques.
