AI moins efficace que les médecins et infirmières pour trier les patients en urgence, selon une étude
Les médecins et les infirmiers se révèlent supérieurs à l’intelligence artificielle (IA) dans le triage des patients en urgences, selon une étude présentée au Congrès européen de médecine d’urgence. Menée par la chercheuse postdoctorale Renata Jukneviciene, de l’université de Vilnius (Lituanie), cette recherche vise à répondre à la surcharge croissante des services d’urgence et à la pression accrue subie par le personnel soignant. Face au développement rapide d’outils comme ChatGPT, les chercheurs ont examiné si l’IA pouvait soutenir le processus de triage, améliorer l’efficacité et alléger la charge de travail. L’étude a impliqué six médecins et 51 infirmiers du service d’urgence de l’hôpital universitaire Santaros Klinikos à Vilnius. Ils ont classé 110 cas cliniques réels, tirés de la base de données PubMed, selon le système de triage de Manchester, qui évalue l’urgence en cinq catégories. Les mêmes cas ont été analysés par ChatGPT (version 3.5). Les résultats montrent que l’IA a globalement sous-performé : son taux de précision s’élevait à 50,4 %, contre 65,5 % pour les infirmiers et 70,6 % pour les médecins. En termes de sensibilité – la capacité à identifier correctement les cas urgents – l’IA atteignait 58,3 %, contre 73,8 % pour les infirmiers et 83,0 % pour les médecins. Cependant, une observation intéressante a été faite : dans la catégorie la plus urgente (triage 1), ChatGPT a surpassé les infirmiers en précision (27,3 % contre 9,3 %) et en spécificité (27,8 % contre 8,3 %), ce qui signifie qu’elle identifiait mieux les cas potentiellement mortels, bien qu’avec une tendance à surtriager. Cette capacité à être plus vigilante dans les cas critiques pourrait constituer un avantage, mais aussi un risque d’inefficacité si elle entraîne une surcharge de ressources. Les médecins ont également surpassé l’IA dans les cas nécessitant une chirurgie (68,4 % de fiabilité) ou des traitements médicaux (65,9 %), tandis que l’IA a légèrement dépassé les infirmiers pour les traitements non invasifs (51,9 % contre 44,5 %). Ces résultats suggèrent que l’IA ne devrait pas remplacer le jugement clinique, mais plutôt servir d’outil d’aide à la décision, notamment pour accompagner les nouveaux professionnels ou en période de surcharge. Les auteurs soulignent que l’IA doit être intégrée avec prudence, avec une supervision humaine rigoureuse. Les limites de l’étude incluent son échantillon restreint, son cadre unique (un seul hôpital), l’absence de données réelles de patient (signes vitaux, suivi clinique) et l’utilisation d’un modèle d’IA non spécialisé en santé. Des recherches futures visent à tester des versions plus avancées d’IA, mieux adaptées au domaine médical, sur des groupes plus vastes, en incluant l’interprétation des ECG et l’entraînement des infirmiers. Dr. Barbra Backus, médecin des urgences à Amsterdam et présidente du comité de sélection des communications du congrès, a salué la pertinence de l’étude. Elle affirme que l’IA peut être utile dans certains domaines, comme l’interprétation des radiographies, mais ne peut en aucun cas remplacer le personnel médical qualifié pour le triage. Elle insiste sur la nécessité d’une évaluation rigoureuse à chaque étape de développement de l’IA en milieu clinique. Enfin, une autre présentation du congrès a mis en lumière l’utilisation de la réalité virtuelle pour former les professionnels à la prise en charge des patients victimes de traumatismes multiples, soulignant ainsi l’importance des outils innovants pour renforcer les compétences en situation d’urgence.
