HyperAIHyperAI

Command Palette

Search for a command to run...

ChatGPT Health sous le feu : première évaluation indépendante révèle des failles critiques en urgence médicale et en crise suicidaire

Une évaluation indépendante de ChatGPT Health, le système d’intelligence artificielle (IA) lancé en janvier 2026 par OpenAI pour fournir des conseils médicaux aux consommateurs, soulève des inquiétudes majeures sur sa sécurité, notamment en matière de triage d’urgence et de gestion des crises suicidaires. Publiée le 23 février 2026 dans Nature Medicine, cette étude menée par des chercheurs de l’Icahn School of Medicine at Mount Sinai constitue la première évaluation indépendante du système depuis son lancement. À un moment où environ 40 millions d’utilisateurs par jour recouraient à l’outil pour obtenir des conseils médicaux, y compris sur l’urgence de se rendre aux urgences, les auteurs ont cherché à savoir si ChatGPT Health pouvait correctement identifier les situations critiques. L’évaluation a consisté à tester 60 scénarios cliniques réalistes couvrant 21 spécialités médicales, chacun soumis à 16 variations contextuelles (genre, race, dynamiques sociales, barrières d’accès aux soins, etc.), pour un total de 960 interactions. Trois médecins indépendants ont déterminé le niveau d’urgence approprié pour chaque cas selon les recommandations de 56 sociétés médicales. Les résultats montrent que, bien que le système ait correctement reconnu les urgences classiques comme les AVC ou les réactions allergiques sévères, il a sous-évalué plus de la moitié des cas jugés urgents par les médecins. Un constat particulièrement inquiétant concerne les crises suicidaires. Bien que le système soit censé orienter les utilisateurs vers la ligne d’écoute 988 en cas de risque élevé, les alertes ont été déclenchées de manière incohérente : elles apparaissaient parfois dans des situations à faible risque, mais restaient absentes lorsque les utilisateurs décrivaient des plans précis de suicide. « Ce n’est pas simplement une incohérence, c’est une inversion du risque clinique », souligne le Dr Girish N. Nadkarni, auteur principal de l’étude. « Quand quelqu’un décrit précisément comment il pourrait se faire du mal, c’est un signe de danger immédiat, pas de faible risque. » Dans certains cas, ChatGPT Health reconnaissait des signes d’alerte dans ses propres explications, tout en conseillant d’attendre ou de rester à la maison. Par exemple, dans un scénario d’asthme, le modèle identifiait des signes précoces de détresse respiratoire, mais recommandait néanmoins de ne pas aller aux urgences. Les auteurs insistent sur le fait que ces résultats ne justifient pas l’abandon des outils d’IA, mais rappellent l’importance de les utiliser avec prudence. Ils conseillent aux patients de ne pas dépendre exclusivement de ces systèmes pour des symptômes graves comme la douleur thoracique, la dyspnée, les réactions allergiques sévères ou les troubles mentaux. En cas de pensées suicidaires, il est impératif de contacter immédiatement la ligne 988 ou de se rendre aux urgences. Pour les futurs médecins, comme la doctorante Alvira Tyagi, cette étude montre que l’intégration critique des outils d’IA dans la formation médicale est essentielle. « Ces systèmes évoluent rapidement, et leur performance à un instant donné ne reflète pas nécessairement leur fiabilité future », affirme-t-elle. Les chercheurs prévoient de continuer à évaluer les versions mises à jour de ChatGPT Health, en élargissant leur portée à la pédiatrie, à la sécurité des médicaments et aux utilisateurs ne parlant pas anglais. Cette étude met en lumière un besoin urgent d’évaluations indépendantes régulières pour garantir que les outils d’IA en santé protègent réellement les patients, surtout aux extrêmes cliniques où les erreurs peuvent avoir des conséquences fatales.

Liens associés

ChatGPT Health sous le feu : première évaluation indépendante révèle des failles critiques en urgence médicale et en crise suicidaire | Articles tendance | HyperAI