Das DeepSeek-Plug-in Ist in Der Ärzteausbildung Willkommen! Eine Gemeinsame Studie Des Shanghai Institute of Physical Education, Der Shanghai Jiao Tong University Und Der Tsinghua University Beweist, Dass Große Modelle Ein „goldener Partner“ Für Die Ausbildung Von Allgemeinmedizinern Sein Können

Im globalen Gesundheitswesen greift Diabetes die Abwehrkräfte des Menschen mit einer tsunamiartigen Geschwindigkeit an. Dieser stille, aber äußerst grausame Kampf um die Gesundheit hat in den letzten 30 Jahren 840 Millionen Menschen erkranken lassen, was bedeutet, dass im Durchschnitt bei jedem neunten Menschen unglücklicherweise Diabetes diagnostiziert wird. Die jüngste Warnung des Magazins „The Lancet“ schlägt Alarm: Schätzungen zufolge wird die Zahl der Diabetespatienten weltweit bis zum Jahr 2050 auf über 1,31 Milliarden steigen. Das bedeutet, dass im Durchschnitt alle 2,3 Sekunden ein Mensch in die riesige Riege der Diabetiker aufgenommen wird.
Diabetes, eine chronische Krankheit, ist wie ein rücksichtsloser „Gesundheitsmähdrescher“. Sie verbraucht nicht nur wertvolle medizinische Ressourcen in Höhe von 101 TP3T pro Jahr, sondern kostet auch jedes Jahr 4 Millionen Menschen auf grausame Weise das Leben. Die dadurch verursachten schweren Komplikationen wie Erblindung, Nierenversagen und Amputationen haben das Leben unzähliger Patienten in endlose Dunkelheit gestürzt und ganze Familien in den Abgrund des Schmerzes gestürzt.
Angesichts dieser schweren Gesundheitskrise ist die offengelegte „Lücke“ im medizinischen Primärsystem herzzerreißend. In meinem Land beispielsweise gibt es pro 100.000 Einwohner nur 0,3 Endokrinologen, was zeigt, wie rar sie sind. Noch schwerwiegender ist, dass den Hausärzten in 70% die Fähigkeit fehlt, die Risikobewertung von Diabeteskomplikationen selbstständig durchzuführen.Das traditionelle spezialisierte Ausbildungsmodell verschlimmert die Situation zweifellos und steckt in einem „dreifachen Dilemma“:Der Ausbildungszyklus dauert oft 3–5 Jahre und ist damit zu lang, um mit der schnellen Iteration des medizinischen Wissens Schritt zu halten. Zwischen den östlichen und westlichen Regionen besteht ein gewaltiger Unterschied bei den Ausbildungsressourcen, der mehr als 40-mal so groß ist, und es kommt zu einer sehr ungleichen Ressourcenverteilung. Die Schulungen sind stark vereinheitlicht, was dazu führt, dass Ärzte an der Basis nach Abschluss der Schulung immer noch kognitive blinde Flecken haben..
Mit der rasanten Entwicklung von Wissenschaft und Technologie haben große Modelle wie DeepSeek und ChatGPT stark in den globalen medizinischen Bereich eingegriffen, neue Hoffnung in die medizinische Ausbildung gebracht und das Paradigma der medizinischen Ausbildung schrittweise umgestaltet. Mit ihren leistungsstarken Wissensreserven und hervorragenden Denkfähigkeiten dürften diese großen Modelle viele Wissenslücken bei Allgemeinmedizinern schließen. Allerdings verläuft diese Revolution im medizinischen Bereich nicht reibungslos und steht vor zwei großen Herausforderungen.einerseits,Das Problem der „Halluzinationen“ bei großen Modellen ist nach wie vor schwerwiegend und stellt ein großes Risiko für die medizinische Sicherheit dar.auf der anderen Seite,Etwa 30% der Fälle von KI-Fehldiagnosen waren auf eine falsche Kennzeichnung der Trainingsdaten zurückzuführen. Darüber hinaus besteht eine große Lücke zwischen der fragmentierten klinischen Praxis und der kontinuierlich aktualisierten Leitlinienbibliothek, was die vollständige Ausschöpfung des Nutzens der KI erheblich einschränkt.
Wenn die diagnostischen Empfehlungen der KI im Widerspruch zur klinischen Erfahrung des Arztes stehen,Die Entwicklung eines neuen Paradigmas der „kollaborativen Entscheidungsfindung zwischen Mensch und Maschine“ ist zu einer zentralen Frage im Hinblick auf Gerechtigkeit und Effizienz im Gesundheitswesen geworden. Nur wenn das große Modell zu einem effektiven „intelligenten externen Gehirn“ für Allgemeinmediziner wird und nicht zu einem „Terminator“, der sie ersetzt, kann die zukünftige KI-Revolution im Diabetesmanagement wirklich Hunderten Millionen Patienten zugutekommen. Dies steht auch in hohem Maße im Einklang mit den Anforderungen der Healthy China-Strategie.
Vor kurzem haben sich das Team von Professor Sheng Bin von der Shanghai Jiao Tong University, das Team von Professor Mao Lijuan von der Shanghai University of Sport, das Team von Professor Huang Tianyin von der Tsinghua University und das Team von Professor Jia Weiping vom Shanghai Institute of Diabetes mit anderen multidisziplinären Kräften zusammengeschlossen, um eine intensive Zusammenarbeit mit führenden internationalen Universitäten und Forschungseinrichtungen wie der Duke University, der Johns Hopkins University in den USA und der University of Melbourne in Australien durchzuführen.Mithilfe des maßgeblichen zweisprachigen Prüfungssystems in Chinesisch und Englisch haben sie gemeinsam ein neues Bewertungsschema erstellt und systematische Tests an 10 gängigen großen Sprachmodellen (LLMs) im In- und Ausland durchgeführt, darunter ChatGPT-3.5, ChatGPT-4.0 und Tongyi Qianwen.
gleichzeitig,Das Team bewertete außerdem die Wirksamkeit von DeepSeek bei der Unterstützung der Ärzteausbildung. Mit dieser Studienreihe lieferte das Team die weltweit ersten prospektiven Praxisbeweise für die tatsächliche Wirksamkeit großer Modelle bei der Unterstützung der Ausbildung von Allgemeinmedizinern. Es eröffnete neue Forschungsrichtungen für die Anwendung großer Modelle im medizinischen Bereich und lieferte eine wertvolle Referenz für die Verbesserung der Grundversorgung.
Die entsprechenden Ergebnisse wurden im Science Bulletin unter dem Titel „Große Sprachmodelle für das Diabetestraining: eine prospektive Studie“ veröffentlicht.

Papieradresse:
https://www.sciencedirect.com/science/article/pii/S2095927325000891
Das Open-Source-Projekt „awesome-ai4s“ vereint mehr als 200 AI4S-Papierinterpretationen und stellt umfangreiche Datensätze und Tools bereit:
https://github.com/hyperai/awesome-ai4s
Testen Sie das LLM-Wissen zum Thema Diabetes
Das Team wählte 10 gängige LLMs im In- und Ausland aus.Einschließlich ChatGPT-3.5, ChatGPT-4.0, Google Bard, LlaMA-7B, LlaMA2-7B, Baidu ERNIE Bot, Tongyi Qianwen, Yilian MedGPT, Huatuo GPT und Chinese LlaMA2-7B.
Der Prüfungsinhalt umfasst zwei Teile, Chinesisch und Englisch.Sie entsprechen der National Examination for Primary Care in Diabetes (NCE-CPDC) von China bzw. der Specialty Certificate Examination in Endocrinology and Diabetes (SCE) des Royal College of Physicians (MRCP (UK)) des Vereinigten Königreichs. Das Studium erfordert von jedem LLM, die Fragen auf Basis der Eingaben zu beantworten und entsprechende Analysehinweise zu geben. Anschließend verglich das Forschungsteam die vom Modell generierten Antworten mit den offiziellen Standardantworten und überprüfte sie, um ihre Genauigkeit zu bewerten. Auf diese Weise konnte die Leistungsfähigkeit und das Anwendungspotenzial jedes Modells im Hinblick auf medizinische Erkenntnisse im Bereich Diabetes umfassend gemessen werden.

Chinesischtest – NCE-CPDC:
* NCE-CPDC: China National Primary Diabetes Care Certificate Examination ist eine Berufsprüfung für PCPs, die vom China National Primary Diabetes Care Office organisiert wird.
Basierend auf den „National Primary Diabetes Prevention and Control Management Guidelines“ deckt es mehrere Aspekte ab, wie etwa Diabetesdefinition, Screening, Diagnose, Überweisung, Lebensstilintervention, medikamentöse Behandlung und Management akuter und chronischer Komplikationen. Die NCE-CPDC-Zertifizierung wird in China allgemein anerkannt, insbesondere unter medizinischem Fachpersonal und Personen, die in der Diabetesbehandlung tätig sind.Ergebnisse mit einer Genauigkeitsrate über 60% gelten als bestanden.Jede Punktzahl darunter gilt als Nichtbestehen.
In diesem TestChatGPT-4.0 schnitt mit einer hohen Genauigkeit von 90,98% hervorragend ab und lag damit deutlich vor anderen Modellen.Alitong YiQianwen zeigte ebenfalls eine starke Wettbewerbsfähigkeit mit einer Genauigkeit von 81.20%, was deutlich besser ist als ChatGPT-3.5. Obwohl einige andere Modelle die Bestehenskriterien nicht erfüllten, lieferten sie wertvolle Daten und Hinweise für spätere technische Verbesserungen und Optimierungen.
Englischtest - SCE:
* SCE: Specialist Certificate Examination des Royal College of Physicians (MRCP (UK)). Die Prüfung ist äußerst professionell und anspruchsvoll; die Bestehensquote britischer Kandidaten lag im Jahr 2023 bei nur 28,6%.
Die SCE-Prüfungsfragen richten sich an Endokrinologen und Diabetes-Spezialisten und decken schwierige Inhalte wie Diabetes-Pathophysiologie, Diagnose, Arzneimitteltherapie und Behandlung akuter und chronischer Komplikationen ab. ChatGPT-4.0 hat die Passlinie mit einer Genauigkeit von 62,50% erfolgreich überschritten.Die Leistung übertrifft die anderer gängiger LLMs (wie Google Bard, LlaMA-7B, LlaMA2-7B usw., die alle die Qualifikationsstandards nicht erfüllt haben) bei weitem. Dieser Erfolg beweist nicht nur das Potenzial von ChatGPT-4.0 bei der Bearbeitung hochschwieriger Fachinhalte, sondern bietet auch eine solide Grundlage für die spätere Anwendung des LLM in der medizinischen Ausbildung.
LLM unterstützt die Ausbildung zum Allgemeinmediziner
Nach Abschluss eines einfachen Quiztests gab sich das Forschungsteam damit nicht zufrieden.Stattdessen untersuchen wir weiter die Anwendungseffekte großer Sprachmodelle (LLM) in tatsächlichen Trainingsszenarien. Dieses Mal wählte das Team sorgfältig sieben Hausärzte als Forschungsteilnehmer aus und bat sie, mit oder ohne Unterstützung von ChatGPT-4.0 an der Nationalen Prüfung zum Zertifikat für die primäre Diabetesversorgung (NCE-CPDC) Chinas teilzunehmen.
Die Testergebnisse sind aufschlussreich: Im ersten Test lag ChatGPT-4.0 mit einer Genauigkeit von 84,82% vor den anderen großen Modellen und ließ alle am Test teilnehmenden Ärzte weit hinter sich. Mit der Unterstützung von ChatGPT-4.0 erzielten die meisten Ärzte sogar noch bessere Ergebnisse.Die durchschnittliche Genauigkeit hat sich stetig von 74,72% auf 75,81% erhöht.
Obwohl einige Ärzte während des Tests Schwierigkeiten hatten, mögliche irreführende Erklärungen im Modell zu identifizieren, was zu einer Verschlechterung ihrer Leistung führte, zeigen die Gesamtdaten, dass Als Hilfsmittel kann der LLM Ärzten zweifellos dabei helfen, ihr Wissen über die Diabetesbehandlung besser zu beherrschen und anzuwenden. Es ist erwähnenswert, dassFast alle am Test teilnehmenden Hausärzte lobten dieses neue Schulungsmodell.Sie sind überzeugt, dass LLM hinsichtlich innerer Konsistenz, professioneller Beratung und Praxistauglichkeit hervorragende Leistungen erbringt, traditionellen Ausbildungsmethoden neue Vitalität verleiht und überraschende Veränderungen mit sich bringt.
Besonders hervorzuheben ist, dass diese Forschungsarbeiten bereits im Jahr 2023 durchgeführt wurden. In den letzten Jahren sind inländische Großsprachenmodelle wie Pilze nach einem Frühlingsregen aus dem Boden geschossen und haben im medizinischen Bereich große Fortschritte erzielt. Unter ihnen schnitt DeepSeek als derzeit mit großer Spannung erwartetes inländisches Allzweckmodell für große Sprachen besonders gut ab.Das Forschungsteam führte strenge Tests zur Genauigkeit der Antworten von DeepSeek auf die Testfragen des NCE-CPDC durch und die Ergebnisse waren ermutigend – die Antwortgenauigkeit von DeepSeek lag bei 91,73% und übertraf damit leicht die 90,98% von ChatGPT-4.0.
Aufgrund dieser Errungenschaft haben wir genügend Grund zu der Annahme, dass sowohl inländische allgemeine große Sprachmodelle als auch große Sprachmodelle mit Schwerpunkt auf vertikalen Feldern in Zukunft ein enormes Potenzial haben werden.Sie werden eine Schlüsselrolle bei der Prävention und Kontrolle chronischer Krankheiten wie Diabetes spielen, die digitale Transformation der Diagnose und Behandlung chronischer Krankheiten wirksam vorantreiben und mit ihrer wissenschaftlichen und technologischen Leistung zum Schutz der öffentlichen Gesundheit beitragen.

Entwicklung von LLMs in der Gesundheitsausbildung
Von der Diabetesversorgung bis zur psychiatrischen Ausbildung
Der Einsatz des LLM in der medizinischen Ausbildung ist nicht auf den Bereich der Diabetesversorgung beschränkt. In den letzten Jahren haben mehrere Forschungsteams im In- und Ausland versucht, LLM mit Deep-Learning-Technologie (DL) zu kombinieren, um intelligente Trainingsplattformen für verschiedene medizinische Fachgebiete zu erstellen.
Am Beispiel der AMC (Agent Mental Clinic), die vom Team um Professor Wu Mengyue vom X-LANCE-Labor der Shanghai Jiao Tong University gebaut wurde, simuliert das System psychologische Diagnose- und Behandlungsszenarien durch automatisierte Dialogagenten. Es kann nicht nur bei der Erstuntersuchung einer Depression helfen, sondern auch angehende Psychiater ausbilden und ihnen eine gewisse Anleitung und Hilfe bieten, bevor sie offiziell zum Praktikum in die Abteilung eintreten. Dieses Modell bietet Psychiatern hilfreiche Übungs- und Anleitungsmöglichkeiten, bevor sie mit der formellen klinischen Arbeit beginnen, verkürzt den Zeitaufwand für die Berufsausbildung erheblich und bietet Patienten eine qualitativ hochwertigere Erstdiagnoseberatung.

DeepDR-LLM: Ein neues Modell für die Diabetesdiagnose und -behandlung, das Sehen und Sprache integriert
Derzeit haben große Sprachmodelle (LLMs) in den Bereichen der medizinischen Informationsverarbeitung und Wissensgenerierung bemerkenswerte Ergebnisse erzielt und leistungsstarke Funktionen demonstriert. Es kann schnell große Mengen medizinischer Informationen integrieren, umfassende Datenunterstützung für medizinische Entscheidungen bieten und vorläufige Diagnoseempfehlungen auf Grundlage der Symptome und der Krankengeschichte des Patienten generieren, wodurch die medizinische Effizienz bis zu einem gewissen Grad verbessert wird.
Aber trotzdem,Der LLM kann den innovativen Geist, das kritische Denken und die klinische Entscheidungsfähigkeit, die Ärzte auszeichnen, noch immer nicht vollständig ersetzen. Bei komplexen Krankheitsbildern sind umfassende Urteile auf Grundlage der Erfahrung und Expertise des Arztes sowie ein gutes Gespür für die individuellen Unterschiede der Patienten wesentliche Faktoren im medizinischen Prozess. Vor diesem Hintergrund widmen sich viele Forscher aktiv der Erforschung des Integrationspfads von LLM- und Deep-Learning-Technologie (DL), um die Genauigkeit klinischer Entscheidungen weiter zu verbessern.
Bei der Erforschung dieses hochmodernen Gebiets sind die Ergebnisse des Teams von Professor Sheng Bin an der Shanghai Jiao Tong University besonders herausragend. Juli 2024Das vom Team in Zusammenarbeit mit führenden internationalen Institutionen entwickelte DeepDR-LLM-Modell wurde in der international renommierten Fachzeitschrift Nature Medicine veröffentlicht.Als dieses Ergebnis veröffentlicht wurde, sorgte es in der internationalen medizinischen Gemeinschaft für großes Aufsehen und wurde von vielen Größen der medizinischen Branche hoch gelobt. Professor Eric Topol, ein Pionier der Präzisionsmedizin, Professor Daniel J. Drucker, Gewinner des Wolf-Preises für Medizin, und Professor Margaret Chan, Ehrengeneraldirektorin der Weltgesundheitsorganisation und Gründungsdekanin der Vanke School of Public Health and Health an der Tsinghua-Universität, haben ihr ihre volle Anerkennung gezollt.

Rückblickend auf die traditionelle Diabetes-Pflegeausbildung verlassen sich Ärzte zur Verbesserung ihrer beruflichen Fähigkeiten vor allem auf umfangreiche schriftliche Materialien und langjährige klinische Erfahrungen. Obwohl diese Methode effektiv ist, weist sie Probleme auf, wie etwa eine geringe Effizienz und Einschränkungen hinsichtlich der Aktualität der Daten.
Als weltweit erstes integriertes Vision-Large-Language-Modellsystem für die Diagnose und Behandlung von Diabetes ist DeepDR-LLM ein innovatives Modell auf dem Gebiet der Diagnose und Behandlung von Diabetes.Es kombiniert auf clevere Weise die leistungsstarken Wissensverarbeitungsfunktionen von LLM und die präzise Bildanalysetechnologie von DL und erzielt so einen großen Durchbruch in der Funktionalität. Das System kann nicht nur schnell und präzise verschiedene fachliche Fragen zur Diabetesdiagnose und -behandlung beantworten, sondern unterstützt Ärzte auch bei der Diagnose einer diabetischen Retinopathie durch Fundusbildanalyse und hilft ihnen, potenzielle Krankheitsrisiken in einem frühen Stadium der Erkrankung zu erkennen.
Es ist erwähnenswert, dassDas DeepDR-LLM-System verfügt außerdem über eine starke Skalierbarkeit und kann nahtlos mit DeepSeek verbunden werden. Die Leistung kann durch die Einbindung der Schlussfolgerungsfunktionen von DeepSeek mithilfe der MoE-Technologie weiter verbessert werden. Nach einer Reihe technologischer Iterationen und Innovationen hat das DeepDR-LLM-System nicht nur die Qualität der Diabetes-Pflegeschulung deutlich verbessert, sodass Ärzte sich modernstes Wissen und Diagnosefähigkeiten effizienter aneignen können, sondern bietet auch praktische und effiziente technische Unterstützung für die klinische Praxis und ermöglicht so Diabetespatienten eine genauere und zeitgerechtere Diagnose und Behandlungshoffnung.
Die Prävention und Behandlung von Diabetes ist ein wichtiges Thema im globalen Gesundheitsbereich und die Ausbildung von Allgemeinmedizinern ist ein Schlüsselfaktor bei der Verbesserung des allgemeinen medizinischen Niveaus. Als „Frontkämpfer“ zum Schutz der öffentlichen Gesundheit ist die Qualität der Ausbildung der Ärzte an der Basis das zentrale Bindeglied bei der Verbesserung des allgemeinen medizinischen Niveaus und steht in direktem Zusammenhang mit der Breite und Tiefe der medizinischen Leistungen.
In diesem Zusammenhang konzentrierte sich das Team von Professor Sheng Bin durch enge Zusammenarbeit und integrierte Innovationen mit einem multidisziplinären Expertenteam auf die Anwendung großer Sprachmodelle (LLM) im Bereich der Diabetespflegeschulung und führte eingehende Untersuchungen durch. Diese Erkundung ist von großer Bedeutung. Es eröffnet nicht nur neue Ideen für die Optimierung der medizinischen Ausbildung mithilfe fortschrittlicher künstlicher Intelligenztechnologie, sondern legt auch eine solide Grundlage für die breite Anwendung medizinischer künstlicher Intelligenz in allen Disziplinen und Bereichen der Zukunft.
Heute zeigt die Kombination „KI + Arzt“ eine enorme Wirkung und verändert nach und nach das Verteilungsmuster medizinischer Ressourcen. Diese goldene Kombination vereint auf clevere Weise die Vorteile beider Behandlungsmethoden: Die menschliche Betreuung und die umfassende klinische Erfahrung der Ärzte bleiben erhalten, was den Patienten Wärme und Vertrauen vermittelt; Gleichzeitig unterstützt KI Ärzte bei der Entscheidungsfindung, die individuelle kognitive Einschränkungen überwindet und so Diagnose und Behandlung präziser und effizienter macht. Wenn das KI-System wie ein unermüdlicher medizinischer Assistent in der Lage ist, die neueste medizinische Literatur in Echtzeit zu analysieren, automatisch Differentialdiagnosekarten zu erstellen und gleichzeitig den globalen Diagnose- und Behandlungskonsens zu aktualisieren, scheinen Ärzte an der Basis die „Superkraft“ zu erhalten, die Beschränkungen von Zeit und Raum zu durchbrechen. Auch in entlegenen Gebieten können sie auf modernste medizinische Erkenntnisse und Diagnosekonzepte zugreifen.
Die Auswirkungen dieser medizinischen Revolution sind weitreichend und ihr Wert geht weit über die Verbesserung der Diabetesprävention und -behandlung hinaus.Darüber hinaus bietet es eine einzigartige chinesische Lösung für globale medizinische Gerechtigkeit.Stellen Sie sich vor, dass Landärzte mithilfe von KI-Systemen wie DeepSeek und Deep DR-LLM Diagnose- und Behandlungsempfehlungen auf dem gleichen Niveau wie Akademiker erhalten könnten, wodurch die Kluft zwischen dem medizinischen Niveau in Stadt und Land erheblich verringert würde. Darüber hinaus können städtische Experten von mühsamer und sich wiederholender Arbeit befreit werden und mehr Energie auf die Untersuchung komplexer Fälle verwenden, was die kontinuierliche Weiterentwicklung der Medizin fördert. Dank dieser Technologie ist der Slogan „Keine Notwendigkeit, das Land zu verlassen, um eine schwere Krankheit zu behandeln“ nicht länger nur ein unerreichbarer Slogan, sondern wird allmählich Wirklichkeit und verleiht dem Aufbau einer Gesundheitsgemeinschaft für die gesamte Menschheit eine starke, intelligente Dynamik.
Blick in die Zukunft
Angesichts des raschen Wandels im weltweiten medizinischen Umfeld ist die technologische Ermächtigung zu einem wichtigen „Instrument“ zur Verbesserung der Qualität medizinischer Leistungen geworden. Durch die enge Integration von Spitzentechnologie und medizinischer Praxis können nicht nur viele seit langem bestehende Defizite in der medizinischen Grundausbildung wirksam behoben werden, sondern auch ein breiterer Entwicklungsspielraum für die Anwendung medizinischer künstlicher Intelligenz geschaffen und dieser zu neuen Höhen verholfen werden.
Mit der kontinuierlichen Optimierung der LLM-Technologie und der kontinuierlichen Ausweitung klinischer Anwendungen dürften sich weitere spannende innovative Ergebnisse durchsetzen, die der Mehrheit der Patienten spürbare gesundheitliche Vorteile bringen, der dynamischen Entwicklung des globalen medizinischen Systems kontinuierlich Weisheit und Vitalität verleihen und der medizinischen Industrie durch die Förderung von Wissenschaft und Technologie zu einer noch besseren Blüte verhelfen.