Aide À Diagnostiquer 362 Maladies Courantes ! L'Université De Cambridge/Oxford/Warwick Et D'autres Ont Proposé Un Cadre De Modèle De Langage Multi-agents De Grande Taille Pour Construire Automatiquement Un Graphe De Connaissances Médicales

Aujourd’hui, la pénurie de ressources médicales est un problème à long terme qui affecte le système médical mondial, et la « pénurie de médecins » est particulièrement importante dans les domaines des soins primaires et de la médecine générale. L’Organisation mondiale de la santé prévoit que d’ici 2030, le monde manquera de 15 millions de professionnels de la santé. En Chine, selon les données du Bureau national des statistiques et de la Commission nationale de la santé, bien que le nombre total de médecins en Chine ait augmenté d’année en année, le nombre de médecins dans certaines zones reculées et rurales est loin d’être suffisant.
Le diagnostic et le traitement à plusieurs niveaux constituent l’un des modèles efficaces pour remédier à la « pénurie de médecins ». Dans ce modèle, lorsque les patients arrivent à l'hôpital, s'ils ne parviennent pas à déterminer quel est leur problème, le médecin généraliste procédera d'abord à un examen préliminaire pour déterminer l'orientation générale du problème, puis orientera le patient vers un spécialiste compétent, tel que la cardiologie, la neurologie, etc., pour un diagnostic et un traitement plus approfondis. Ce modèle à plusieurs niveaux et collaboratif garantit un diagnostic efficace, complet et professionnel, réduit la charge de travail des spécialistes, rend leur formation plus ciblée, raccourcissant ainsi le cycle de formation et reconstituant rapidement les ressources médicales.
Mais le temps et l’énergie des médecins sont finalement limités. La manière d’utiliser des technologies avancées telles que l’intelligence artificielle pour améliorer l’efficacité du diagnostic et ainsi atténuer la pénurie de ressources médicales est devenue une priorité de l’industrie. Inspiré du modèle de collaboration hiérarchique médicale mentionné ci-dessus,Une équipe de recherche de l’Université de Warwick, de l’Université de Cranfield, de l’Université de Cambridge et de l’Université d’Oxford a proposé KG4Diagnosis.Il s’agit d’un nouveau cadre multi-agents hiérarchique qui simule le système médical réel de collaboration entre médecins généralistes et spécialistes via une architecture à deux couches. Il est utilisé pour automatiser la construction, le diagnostic, le traitement et le raisonnement des graphes de connaissances médicales. Il surmonte les limites des méthodes existantes de construction de graphes de connaissances médicales en termes d'évolutivité et de traitement de données non structurées, couvrant 362 maladies courantes, couvrant plusieurs domaines médicaux tels que l'obésité.
Les résultats associés ont été publiés dans le cadre de la conférence AAAI-25 Bridge Program sous le titre « KG4Diagnosis : un cadre LLM multi-agent hiérarchique avec amélioration du graphe de connaissances pour le diagnostic médical ».

Suivez le compte officiel et répondez « Medical Knowledge Graph » pour obtenir le PDF complet
Ensemble de données de réponses aux questions de texte médical MedQA :
Le projet open source « awesome-ai4s » rassemble plus de 100 interprétations d'articles AI4S et fournit des ensembles de données et des outils massifs :
https://github.com/hyperai/awesome-ai4s
Quelle est la signification disruptive de KG4Diagnosis ?
Pourquoi les chercheurs ont-ils développé KG4Diagnosis ?
En fait, cela découle d’une idée, à savoir si l’intelligence artificielle peut être utilisée pour simuler le système médical hiérarchique dans le monde réel afin de résoudre la complexité du raisonnement diagnostique médical. C'est ainsi qu'est né le cadre KG4Diagnosis, un cadre multi-agents hiérarchique intégrant un modèle de langage de médecin généraliste (GPLLM) et plusieurs modèles de langage d'experts spécifiques à un domaine (Consultant-LLM) - l'agent médecin généraliste (GP) effectue l'évaluation initiale et le triage, puis se coordonne avec les agents spécialisés pour effectuer une analyse spécifique au domaine.
Comment le cadre a-t-il été construit ?
En termes simples, cela peut être divisé en 5 étapes :

(1) Le texte médical d'entrée est segmenté en blocs de données conformes aux contraintes de contexte du graphe de connaissances et traités par les modules d'extraction d'entités et d'extraction de relations basés sur la sémantique ;
(2) Les entités et relations extraites sont stockées dans une base de données dédiée ;
(3) Ces bases de données sont utilisées pour construire le Medical Knowledge Graph ;
(4) Combiner des graphes de connaissances médicales avec de grands modèles de langage (LLM) et des systèmes multi-agents pour améliorer le raisonnement diagnostique ;
(5) Les résultats du diagnostic sont renvoyés au point de terminaison de l’utilisateur via un raisonnement guidé par l’homme.
De toute évidence, cette approche combine les vastes capacités des grands modèles linguistiques avec la précision des connaissances médicales spécialisées pour obtenir des résultats diagnostiques plus avancés. Selon l'équipe de recherche, la méthode de formation du système couvre 362 maladies courantes dans plusieurs spécialités médicales, représentant un large éventail de diagnostics médicaux.
Quel est l’effet d’application réel de ce système ?
Le diagramme suivant montre comment le nouveau cadre proposé par l’étude collabore au processus de diagnostic et comment les systèmes d’IA peuvent aider à fournir des conseils médicaux personnalisés : le patient décrit les symptômes, le médecin pose des questions de clarification et l’IA fournit des explications et des suggestions.

* Patient : « Docteur, j’ai des bourdonnements d’oreilles ces derniers temps, surtout la nuit. J’ai l’impression d’entendre un bourdonnement constant qui affecte mon sommeil et ma concentration. »
* Médecin : « Vos acouphènes sont-ils constants ou intermittents ? Présentez-vous d’autres symptômes, comme des maux de tête, une perte auditive ou des douleurs aux oreilles ? »
* AI : « Nous sommes désolés d'apprendre votre inconfort. Les acouphènes peuvent être causés par divers facteurs, tels qu'une exposition à un bruit intense, des otites, l'hypertension artérielle ou le stress. Avez-vous récemment passé un test auditif ou un examen des oreilles ? Ces examens peuvent aider à déterminer la gravité et les causes possibles de vos acouphènes. »
La figure ci-dessous démontre davantage l’expertise du système dans le domaine du graphique de connaissances dans le domaine de l’obésité, montrant la relation entre l’obésité, le diabète de type 2 et les maladies cardiovasculaires, leurs symptômes communs, leurs traitements et leurs comorbidités, et soulignant le rôle multiforme des médicaments dans la résolution de problèmes de santé complexes.

En résumé, cette étude aborde les défis d'hallucination auxquels sont confrontés les grands modèles de langage (LLM) dans le diagnostic médical grâce à la vérification multi-agents et aux contraintes du graphe de connaissances, et vérifie l'efficacité de ces mécanismes grâce à des tests de référence complets. Dans le même temps, les chercheurs ont également démontré la valeur pratique de ce cadre à travers des scénarios médicaux réels, et ses applications futures méritent d’être attendues avec impatience.
La technologie et les applications sont toutes deux en plein essor ! Le diagnostic assisté par intelligence artificielle a un avenir prometteur
Progrès de la recherche sur le graphe des connaissances médicales
KG4Diagnosis proposé par l'équipe de recherche ci-dessus est un cadre de modèle de langage multi-agent hiérarchique de grande taille basé sur l'amélioration du graphe de connaissances. Les graphes de connaissances (KG) décrivent les concepts du monde physique et leurs relations sous forme symbolique.
Actuellement, les méthodes de construction de graphiques de connaissances médicales incluent des systèmes traditionnels basés sur des règles et des modèles avancés d’intelligence artificielle. Les approches basées sur des règles offrent une fiabilité mais manquent d'évolutivité, tandis que les modèles de langage comme GPT et MedPaLM montrent un potentiel dans la génération de connaissances structurées à partir de données non structurées, mais ils sont confrontés à des problèmes d'hallucination et de précision.
Face à ces défis, de nombreuses équipes de recherche ont exploré de multiples directions : par exemple, afin de relever le défi des hallucinations dans les grands modèles de langage, la récupération de faits pertinents à partir de graphes de connaissances est considérée comme une approche prometteuse. Les méthodes d’amélioration KG existantes nécessitent souvent plusieurs cycles de récupération et de vérification pour chaque fait, ce qui entrave leur application dans des scénarios pratiques. Une équipe de recherche de l'Imperial College de Londres a proposé une méthode de récupération de graphes de connaissances améliorés par auto-amélioration (Re-KGR) pour améliorer la factualité des réponses LLM dans le domaine médical avec moins d'efforts de récupération. Les résultats associés ont été publiés sur arXiv sous le titre « Atténuer les hallucinations dans les grands modèles linguistiques via la récupération des connaissances améliorée par l'auto-raffinement ».
Dans le même temps, l’industrie a également obtenu des résultats révolutionnaires dans l’utilisation de graphiques de connaissances médicales pour construire de grands modèles médicaux. Par exemple, les modèles fondamentaux (FM) peuvent être appris à partir de grandes quantités de données non étiquetées pour démontrer des performances supérieures sur un large éventail de tâches. Cependant, les FM développés pour le domaine biomédical sont encore largement unimodaux. Pour surmonter cette limitation, une équipe de recherche de l'UIUC a proposé BioBRIDGE, qui utilise des graphiques de connaissances pour apprendre la transformation entre un FM unimodal et un autre FM unimodal sans affiner aucun FM unimodal sous-jacent.
Les résultats montrent que BioBRIDGE peut battre la meilleure méthode d'intégration KG de base (en moyenne environ 76,3% plus élevée) dans la tâche de récupération intermodale. Les résultats de recherche associés ont été intitulés « BIOBRIDGE : BRIDGING BIOMEDICAL FOUNDATION MODELS VIA KNOWLEDGE GRAPHS » et ont été acceptés par l'ICLR 2024.
Le diagnostic assisté par l'intelligence artificielle contribue à améliorer l'efficacité et à pallier la pénurie de ressources médicales
Les avancées technologiques visent en fin de compte à alimenter des applications pratiques, à réduire la charge de travail des médecins et à améliorer la précision et l’efficacité du diagnostic. En intégrant une grande quantité de connaissances médicales et de données cliniques, l’IA a réalisé de nombreuses avancées clés dans le diagnostic assisté ces dernières années.
En novembre 2024, le diagnostic assisté par l’IA a été inclus pour la première fois dans les directives du projet de la National Healthcare Security Administration. Afin de soutenir la technologie assistée par intelligence artificielle relativement mature pour entrer dans des applications cliniques et éviter une charge supplémentaire pour les patients, la National Healthcare Security Administration a analysé les scénarios d'application potentiels de l'intelligence artificielle et a établi des éléments d'extension « assistés par intelligence artificielle » dans les examens radiologiques, les examens échographiques et les projets de réadaptation. En un sens, cela pose les bases politiques de l’application à grande échelle du diagnostic assisté par l’IA à l’avenir.
En termes d'applications spécifiques, en février 2024, l'équipe de l'Université de technologie de Chine du Sud a annoncé avoir développé un système intelligent de dépistage des maladies oculaires, qui intègre un modèle d'IA formé sur la base d'un ensemble de données et d'une série de dispositifs matériels tels qu'une caméra de fond d'œil. Il peut fournir des recommandations diagnostiques pour plus de 30 maladies dans les 15 secondes suivant la prise de vue couleur du fond d'œil.
En juin 2024, OpenAI a déclaré sur son blog officiel que Color Health avait utilisé le modèle GPT-4o d'OpenAI pour développer un copilote assistant IA pour aider les médecins à dépister et à traiter les patients atteints de cancer, obtenant ainsi une meilleure efficacité de traitement. Selon les données officielles, les institutions médicales qui utilisent des assistants IA peuvent identifier 4 fois plus de résultats pathologiques que celles qui n'utilisent pas d'assistants IA. De plus, avec l’assistant IA, les cliniciens prenaient en moyenne cinq minutes pour analyser les dossiers des patients, alors que sans lui, les données seraient fragmentées, ce qui pourrait entraîner des semaines de retard.
En outre, il est rapporté qu'iFlytek Medical a corrigé 1,6 million d'erreurs de diagnostic majeures et détecté 60 millions de médicaments irrationnels ou suspectés d'être erronés grâce au diagnostic assisté par l'IA, améliorant ainsi les capacités de diagnostic et de traitement primaires et prévenant les erreurs de diagnostic et les diagnostics manqués.
Sur la base de la technologie, je crois que l’IA deviendra le « bras droit » des médecins à l’avenir, améliorant continuellement l’accessibilité et la qualité des services médicaux.
Références :
1.https://arxiv.org/abs/2412.16833
2.https://zh.wikipedia.org/wiki/%E7%9F%A5%E8%AD%98%E5%9C%96%E8%AD%9C
3.https://53ai.com/news/LargeLanguageModel/2024060240513.html
4.https://hub.baai.ac.cn/view/36889
5.https://www.yicai.com/news/102371268.html
6.https://m.yicai.com/news/102153745.html