HyperAI

La Formation Des Médecins Accueille Le Plug-in DeepSeek ! Une Étude Collaborative Entre L'institut D'éducation Physique De Shanghai, L'université Jiao Tong De Shanghai Et L'université Tsinghua Prouve Que Les Grands Modèles Peuvent Devenir Un « Partenaire D'or » Pour La Formation Des Médecins De Soins Primaires.

特色图像

Dans le paysage sanitaire mondial, le diabète attaque les défenses de la santé humaine à un rythme féroce de type « tsunami ». Au cours des 30 dernières années, cette bataille silencieuse mais extrêmement cruelle pour la santé a causé la maladie à 840 millions de personnes, ce qui signifie qu’en moyenne, une personne sur neuf est malheureusement diagnostiquée diabétique. Le dernier avertissement publié par « The Lancet » a sonné l'alarme : on estime que d'ici 2050, le nombre de patients diabétiques dans le monde dépassera 1,31 milliard, ce qui signifie qu'en moyenne toutes les 2,3 secondes, une personne sera forcée de rejoindre les rangs immenses du diabète.

Le diabète, une maladie chronique, est comme un « moissonneur de santé » impitoyable. Non seulement il consomme de précieuses ressources médicales à un rythme de 10% par an, mais il tue également sans pitié 4 millions de personnes chaque année. Les graves complications qu’elle entraîne, telles que la cécité, l’insuffisance rénale et l’amputation, ont plongé la vie d’innombrables patients dans une obscurité sans fin et ont plongé des familles entières dans l’abîme de la douleur.

Dans cette grave crise sanitaire, le « fossé » mis en évidence dans le système médical primaire est déchirant. Si l’on prend l’exemple de mon pays, il n’y a que 0,3 endocrinologue pour 100 000 habitants, ce qui montre à quel point ils sont rares. Ce qui est encore plus grave, c’est que les médecins de premier recours (MPR) du 70% n’ont pas la capacité d’effectuer de manière indépendante l’évaluation des risques de complications du diabète.Le modèle traditionnel de formation spécialisée aggrave sans aucun doute la situation et se trouve pris dans un « triple dilemme » :Le cycle de formation dure souvent de 3 à 5 ans, ce qui est trop long pour suivre l’évolution rapide des connaissances médicales. Il existe une énorme différence dans les ressources de formation entre les régions de l’Est et de l’Ouest, avec un écart de plus de 40 fois, et une répartition des ressources très inégale. Les formations sont très homogénéisées, ce qui fait que 731 médecins de terrain TP3T ont encore des angles morts cognitifs après avoir terminé la formation..

Avec le développement rapide de la science et de la technologie, de grands modèles tels que DeepSeek et ChatGPT sont fortement intervenus dans le domaine médical mondial, apportant un nouvel espoir à l'enseignement médical et reconstruisant progressivement le paradigme de l'enseignement médical. Grâce à leurs puissantes réserves de connaissances et à leurs excellentes capacités de raisonnement, ces grands modèles devraient combler de nombreux angles morts dans les connaissances des médecins de premier recours. Cependant, cette révolution dans le domaine médical ne se déroule pas sans heurts et se heurte à deux défis majeurs.d'une part,Le problème des « hallucinations » des grands modèles reste grave, ce qui représente un risque important pour la sécurité médicale ;d'autre part,Environ 301 cas de diagnostic erroné d’IA ont été causés par un étiquetage incorrect des données de formation. En outre, il existe un énorme fossé entre la pratique clinique fragmentée et la bibliothèque de lignes directrices continuellement mise à jour, ce qui restreint sérieusement la pleine réalisation de la valeur de l’IA.

Lorsque les recommandations diagnostiques données par l’IA entrent en conflit avec l’expérience clinique du médecin,Comment construire un nouveau paradigme de « prise de décision collaborative homme-machine » est devenu un enjeu clé en matière d’équité et d’efficacité médicales.  Ce n’est qu’en faisant du grand modèle un « cerveau externe intelligent » efficace pour les médecins de soins primaires, plutôt qu’un « terminateur » qui les remplace, que la future révolution de l’IA dans la gestion du diabète pourra véritablement profiter à des centaines de millions de patients. Cela est également tout à fait cohérent avec les besoins de la stratégie « Chine saine ».

Récemment, l'équipe du professeur Sheng Bin de l'Université Jiao Tong de Shanghai, l'équipe du professeur Mao Lijuan de l'Université des sports de Shanghai, l'équipe du professeur Huang Tianyin de l'Université Tsinghua et l'équipe du professeur Jia Weiping de l'Institut du diabète de Shanghai se sont associées à d'autres forces multidisciplinaires pour mener une coopération approfondie avec les meilleures universités et institutions de recherche internationales telles que l'Université Duke, l'Université Johns Hopkins aux États-Unis et l'Université de Melbourne en Australie.Avec l'aide du système d'examen bilingue faisant autorité en chinois et en anglais, ils ont conjointement élaboré un nouveau système d'évaluation et mené des tests systématiques sur 10 grands modèles linguistiques (LLM) traditionnels au pays et à l'étranger, notamment ChatGPT-3.5, ChatGPT-4.0 et Tongyi Qianwen.

en même temps,L’équipe a également évalué l’efficacité de DeepSeek pour aider à la formation des médecins.  Grâce à cette série d’études, l’équipe a fourni la première preuve prospective concrète au monde de l’efficacité réelle des grands modèles pour aider à la formation des médecins de soins primaires. Il a ouvert de nouvelles directions de recherche pour l’application de grands modèles dans le domaine médical et a fourni une référence précieuse pour améliorer les niveaux de soins primaires.

Les résultats correspondants ont été publiés dans Science Bulletin sous le titre « Modèles de langage de grande taille pour la formation au diabète : une étude prospective ».

Adresse du document :

https://www.sciencedirect.com/science/article/pii/S2095927325000891

Le projet open source « awesome-ai4s » rassemble plus de 200 interprétations d'articles AI4S et fournit des ensembles de données et des outils massifs :
https://github.com/hyperai/awesome-ai4s

Testez les connaissances du LLM sur le diabète

L’équipe a sélectionné 10 LLM traditionnels au pays et à l’étranger.Y compris ChatGPT-3.5, ChatGPT-4.0, Google Bard, LlaMA-7B, LlaMA2-7B, Baidu ERNIE Bot, Tongyi Qianwen, Yilian MedGPT, Huatuo GPT et Chinese LlaMA2-7B.

Le contenu du test comprend deux parties, le chinois et l'anglais.Ils correspondent respectivement à l'examen national de soins primaires en diabète (NCE-CPDC) de Chine et à l'examen de certificat de spécialité en endocrinologie et diabète (SCE) du Royal College of Physicians (MRCP (UK)) du Royaume-Uni. L'étude exige que chaque LLM réponde aux questions en fonction des informations saisies et fournisse des instructions d'analyse correspondantes. Par la suite, l’équipe de recherche a comparé les réponses générées par le modèle avec les réponses standard officielles et les a vérifiées pour évaluer leur exactitude, mesurant ainsi de manière exhaustive les performances et le potentiel d’application de chaque modèle en termes de connaissances médicales dans le domaine du diabète.

Processus de conception de l'étude

Test de chinois - NCE-CPDC :

* NCE-CPDC : L'examen national de certificat de soins primaires du diabète de Chine est un examen professionnel conçu pour les médecins de premier recours, organisé par le Bureau national de soins primaires du diabète de Chine.

Basé sur les « Lignes directrices nationales de gestion de la prévention et du contrôle du diabète primaire », il couvre de multiples aspects tels que la définition du diabète, le dépistage, le diagnostic, l'orientation, l'intervention sur le mode de vie, le traitement médicamenteux et la gestion des complications aiguës et chroniques. La certification NCE-CPDC est largement reconnue en Chine, en particulier parmi les professionnels de la santé et ceux impliqués dans les soins du diabète.Les résultats avec un taux de précision supérieur à 60% sont considérés comme réussis.Tout score inférieur à celui-ci est considéré comme un échec.

Dans ce test,ChatGPT-4.0 a obtenu des performances exceptionnelles avec une précision élevée de 90,98%, nettement supérieure aux autres modèles.Alitong YiQianwen a également montré une forte compétitivité, avec une précision de 81.20%, ce qui est nettement meilleur que ChatGPT-3.5. Bien que certains autres modèles n’aient pas réussi à répondre aux critères de réussite, ils ont fourni des données et des orientations précieuses pour les améliorations et optimisations techniques ultérieures.

Test d'anglais - SCE :

* SCE : Examen de Certificat de Spécialiste du Collège Royal des Médecins (MRCP (Royaume-Uni)). L'examen est très professionnel et stimulant, le taux de réussite des candidats britanniques en 2023 n'étant que de 28,6%.

Les questions de l'examen SCE sont conçues pour les endocrinologues et les spécialistes du diabète et couvrent des contenus difficiles tels que la physiopathologie du diabète, le diagnostic, la pharmacothérapie et la gestion des complications aiguës et chroniques. ChatGPT-4.0 a passé avec succès la ligne de passage avec une précision de 62,50%.Les performances dépassent de loin celles des autres LLM traditionnels (tels que Google Bard, LlaMA-7B, LlaMA2-7B, etc., qui n'ont pas tous réussi à répondre aux normes de qualification). Cette réussite prouve non seulement le potentiel de ChatGPT-4.0 dans la gestion de contenus professionnels très difficiles, mais fournit également une base solide pour l'application ultérieure du LLM dans la formation médicale.

Le LLM aide à la formation des médecins de soins primaires

Après avoir complété un simple test, l’équipe de recherche ne s’est pas arrêtée là.Au lieu de cela, nous explorons davantage l’effet d’application du grand modèle de langage (LLM) dans des scénarios de formation réels.  Cette fois, l'équipe a soigneusement sélectionné 7 médecins de soins primaires (PCP) comme sujets de recherche et leur a demandé de passer l'examen national de certificat de soins primaires du diabète (NCE-CPDC) de Chine avec ou sans l'aide de ChatGPT-4.0.

Les résultats du test sont révélateurs : lors du premier test, ChatGPT-4.0 a devancé les autres grands modèles avec une précision de 84,82%, laissant tous les médecins participant au test loin derrière. Grâce à ChatGPT-4.0, la plupart des médecins ont obtenu des résultats encore meilleurs.La précision moyenne a augmenté régulièrement de 74,72% à 75,81%.

Bien que certains médecins aient eu du mal à identifier d'éventuelles explications trompeuses dans le modèle pendant le test, ce qui a conduit à une baisse de leurs performances, les données globales montrent que En tant qu’outil auxiliaire, le LLM peut sans aucun doute aider efficacement les médecins à améliorer leur maîtrise et leur application des connaissances en matière de soins du diabète.  Il convient de noter quePresque tous les médecins généralistes qui ont participé au test ont salué ce nouveau modèle de formation.Ils estiment que le LLM est très performant en termes de cohérence interne, de conseils professionnels et de praticité, insufflant une nouvelle vitalité aux méthodes de formation traditionnelles et apportant des changements surprenants.

Il convient de souligner en particulier que ces travaux de recherche ont été réalisés dès 2023. Ces dernières années, les grands modèles linguistiques nationaux ont poussé comme des champignons après une pluie de printemps et ont fait de grands progrès dans le domaine médical. Parmi eux, DeepSeek, en tant que modèle de langage généraliste national très attendu, a particulièrement bien fonctionné.L'équipe de recherche a effectué des tests rigoureux sur la précision des réponses de DeepSeek aux questions du test NCE-CPDC, et les résultats ont été encourageants : la précision des réponses de DeepSeek a atteint 91,73%, dépassant légèrement les 90,98% de ChatGPT-4.0.

Sur la base de cette réussite, nous avons suffisamment de raisons de croire qu’à l’avenir, les modèles linguistiques généraux nationaux et les modèles linguistiques axés sur les domaines verticaux auront un énorme potentiel.Ils joueront un rôle clé dans la prévention et le contrôle des maladies chroniques telles que le diabète, favoriseront efficacement la transformation numérique du diagnostic et du traitement des maladies chroniques et apporteront une puissance scientifique et technologique puissante à la protection de la santé publique.

Perspectives d'avenir pour les LLM dans la formation des médecins généralistes et la prise en charge des patients diabétiques

Développement des LLM en formation aux soins de santé

Des soins du diabète à la formation psychiatrique

L’utilisation du LLM dans la formation médicale ne se limite pas au domaine des soins du diabète.  Ces dernières années, plusieurs équipes de recherche nationales et internationales ont tenté de combiner le LLM avec la technologie d’apprentissage en profondeur (DL) pour créer des plateformes de formation intelligentes pour différentes spécialités médicales.

Prenant comme exemple l'AMC (Agent Mental Clinic) construit par l'équipe du professeur Wu Mengyue du laboratoire X-LANCE de l'université Jiao Tong de Shanghai, le système simule des scénarios de diagnostic et de traitement psychologiques grâce à des agents de dialogue automatisés. Il peut non seulement aider au dépistage initial de la dépression, mais également former les psychiatres stagiaires et leur fournir des conseils et de l'aide avant qu'ils n'entrent officiellement au département pour un stage. Ce modèle offre aux psychiatres des répétitions et des conseils utiles avant d’entrer dans un travail clinique formel, réduit considérablement le coût en temps de formation professionnelle et fournit aux patients des conseils de diagnostic initial de meilleure qualité.


Cliquez pour voir le rapport détaillé : La clinique psychologique Agent est en ligne ! Sur la base de 1 300 dialogues de consultation sur la dépression, l’équipe de l’Université Jiaotong de Shanghai a construit un agent de dialogue modèle de grande taille capable de diagnostiquer la dépression.

Processus de fonctionnement du système AMC


DeepDR-LLM : Un nouveau modèle de diagnostic et de traitement du diabète intégrant la vision et le langage

Actuellement, les grands modèles de langage (LLM) ont obtenu des résultats remarquables dans les domaines du traitement de l’information médicale et de la génération de connaissances, démontrant de puissantes capacités. Il peut intégrer rapidement des quantités massives d'informations médicales, fournir un support de données riche pour la prise de décision médicale et générer des recommandations diagnostiques préliminaires basées sur les symptômes du patient et les antécédents médicaux, améliorant ainsi l'efficacité médicale dans une certaine mesure.

Mais même ainsi,Le LLM ne peut toujours pas remplacer complètement l’esprit d’innovation, la pensée critique et la capacité de prise de décision clinique qui sont propres aux médecins.  Lorsque les médecins sont confrontés à des conditions complexes, des jugements complets fondés sur leur expérience et leur expertise, ainsi que leur connaissance approfondie des différences individuelles entre les patients, sont des facteurs essentiels dans le processus médical. Dans ce contexte, de nombreux chercheurs se sont activement consacrés à l’exploration de la voie d’intégration de la technologie LLM et de l’apprentissage profond (DL), s’efforçant d’améliorer encore la précision de la prise de décision clinique.

Dans l’exploration de ce domaine de pointe, les résultats de l’équipe du professeur Sheng Bin de l’Université Jiao Tong de Shanghai sont particulièrement remarquables. Juillet 2024Le modèle DeepDR-LLM, développé par l'équipe en collaboration avec des institutions internationales de premier plan, a été publié dans la revue universitaire de renommée internationale Nature Medicine.Une fois ce résultat publié, il a provoqué une forte sensation dans la communauté médicale internationale et a reçu les éloges de nombreux géants du domaine médical. Le professeur Eric Topol, pionnier de la médecine de précision, le professeur Daniel J. Drucker, lauréat du prix Wolf de médecine, et la professeure Margaret Chan, directrice générale honoraire de l'Organisation mondiale de la santé et doyenne fondatrice de la Vanke School of Public Health and Health de l'université Tsinghua, lui ont tous accordé une pleine reconnaissance.

Architecture du système DeepDR-LLM

En repensant à la formation traditionnelle en soins du diabète, les médecins s’appuient principalement sur une grande quantité de documents écrits et sur une expérience clinique accumulée à long terme pour améliorer leurs capacités professionnelles. Bien que cette méthode soit efficace, elle présente des problèmes tels qu’une faible efficacité et des limitations en termes d’actualité des données.

En tant que premier système de modèle de langage vision-large intégré au monde pour le diagnostic et le traitement du diabète, DeepDR-LLM est un modèle innovant dans le domaine du diagnostic et du traitement du diabète.Il combine intelligemment les puissantes capacités de traitement des connaissances de LLM et la technologie d'analyse d'image précise de DL, réalisant une avancée majeure en termes de fonctionnalité. Le système peut non seulement répondre rapidement et avec précision à diverses questions professionnelles liées au diagnostic et au traitement du diabète, mais également aider les médecins à diagnostiquer la rétinopathie diabétique grâce à l'analyse de l'image du fond d'œil, aidant les médecins à détecter les risques potentiels de maladie aux premiers stades de la maladie.

Il convient de mentionner queLe système DeepDR-LLM présente également une forte évolutivité et peut être connecté de manière transparente à DeepSeek.  Les performances peuvent être encore améliorées en incorporant les capacités de raisonnement de DeepSeek à l'aide de la technologie MoE. Après une série d'itérations et d'innovations technologiques, le système DeepDR-LLM a non seulement considérablement amélioré la qualité de la formation aux soins du diabète, permettant aux médecins de maîtriser plus efficacement les connaissances de pointe et les compétences diagnostiques, mais a également fourni un soutien technique pratique et efficace pour la pratique clinique, apportant un diagnostic et un traitement plus précis et plus rapide aux patients diabétiques.

Cliquez pour voir le rapport détaillé : La première mondiale ! L'Université Tsinghua/Université Jiaotong de Shanghai et d'autres construisent conjointement un modèle de langage visuel pour le diagnostic et le traitement du diabète, publié dans Nature

La prévention et le traitement du diabète constituent un enjeu important dans le domaine de la santé mondiale, et la formation des médecins de soins primaires est un maillon essentiel pour améliorer le niveau médical global. En tant que « gardes de première ligne » chargés de protéger la santé publique, la qualité de la formation des médecins de terrain est le maillon essentiel de l’amélioration du niveau médical global et est directement liée à l’étendue et à la profondeur des services médicaux.

Dans ce contexte, l'équipe du professeur Sheng Bin, grâce à une coopération étroite et à une innovation intégrée avec une équipe d'experts multidisciplinaires, s'est concentrée sur l'application de grands modèles de langage (LLM) dans le domaine de la formation aux soins du diabète et a mené une exploration approfondie. Cette exploration est d’une grande importance. Cela ouvre non seulement de nouvelles idées pour optimiser la formation médicale à l’aide d’une technologie d’intelligence artificielle avancée, mais jette également une base solide pour l’application généralisée de l’intelligence artificielle médicale dans toutes les disciplines et tous les domaines à l’avenir.


Aujourd’hui, la combinaison « IA + médecin » montre une puissance considérable et remodèle progressivement le modèle de distribution des ressources médicales.  Cette combinaison dorée combine intelligemment les avantages des deux : les soins humanistes et la riche expérience clinique des médecins sont conservés, procurant aux patients chaleur et confiance ; Dans le même temps, l’IA offre aux médecins une aide à la décision qui transcende les limites cognitives individuelles, rendant le diagnostic et le traitement plus précis et plus efficaces. Lorsque le système d'IA est comme un assistant médical infatigable, capable d'analyser la littérature médicale la plus récente en temps réel, de générer automatiquement des cartes de diagnostic différentiel et de mettre à jour simultanément le consensus mondial sur le diagnostic et le traitement, les médecins de base semblent avoir le « super pouvoir » de briser les limites du temps et de l'espace. Même s’ils se trouvent dans des régions éloignées, ils peuvent obtenir les connaissances médicales et les idées de diagnostic les plus avancées.

L’impact de cette révolution médicale est considérable et sa valeur va bien au-delà de l’amélioration du niveau de prévention et de traitement du diabète lui-même.Il fournit également une solution chinoise unique en matière d’équité médicale mondiale.Imaginez que les médecins ruraux puissent obtenir des conseils de diagnostic et de traitement au même niveau que les universitaires avec l’aide de systèmes d’IA tels que DeepSeek et Deep DR-LLM, ce qui réduit considérablement l’écart entre les niveaux médicaux urbains et ruraux ; Les experts urbains peuvent également être libérés du travail fastidieux et répétitif et consacrer plus d’énergie à l’étude de cas complexes, favorisant ainsi le développement continu de la médecine. Grâce à cette technologie, « pas besoin de quitter le comté pour soigner une maladie grave » n’est plus seulement un slogan inaccessible, mais devient progressivement une réalité, insufflant une forte dynamique intelligente à la construction d’une communauté de santé pour toute l’humanité.

Regard vers l'avenir

Alors que l’environnement médical mondial évolue rapidement, l’autonomisation technologique est devenue un « outil » important pour améliorer la qualité des services médicaux. L’intégration profonde de la technologie de pointe et de la pratique médicale peut non seulement combler efficacement les nombreuses lacunes de longue date dans la formation médicale primaire, mais également ouvrir un espace de développement plus large pour l’application de l’intelligence artificielle médicale, l’aidant à atteindre de nouveaux sommets.

Avec l'optimisation continue de la technologie LLM et l'expansion continue des applications cliniques, des résultats innovants plus passionnants devraient prendre racine, apportant des avantages tangibles pour la santé de la majorité des patients, injectant une sagesse et une vitalité continues dans le développement vigoureux du système médical mondial et permettant à l'industrie médicale de s'épanouir plus brillamment sous la promotion de la science et de la technologie.