HyperAI

Durch Die Erfassung Von Daten Von 451 Älteren Patienten Mit Koronarer Herzkrankheit Im Krankenhaus 301 Führte Das Hubei Macheng People's Hospital Ein Maschinelles Lernmodell Ein, Um Die Sterblichkeitsrate Von Patienten Innerhalb Eines Jahres Genau Vorherzusagen

vor 2 Jahren
Information
zhaorui
特色图像

Laut der Diabetes-Umfrage von 2017 liegt die Zahl der älteren Menschen mit Diabetes in meinem Land bei 78,13 Millionen. Durch die Kombination mehrerer groß angelegter Bevölkerungsstudien wurde festgestellt, dass ein starker Zusammenhang zwischen abnormalem Glukosestoffwechsel und Herz-Kreislauf-Erkrankungen besteht. Das heißt, bei Diabetikern treten häufig Komplikationen wie eine koronare Herzkrankheit auf, und letztere ist zu einer der Haupttodesursachen bei Diabetikern geworden – etwa 751 bis 33 Prozent der Diabetiker starben an einer koronaren Herzkrankheit. Jedoch,Derzeit gibt es nur wenige Studien zu den Risikofaktoren für das Überleben von Patienten mit koronarer Herzkrankheit und Diabetes oder gestörter Glukosetoleranz.

|Bemerkungen:Bei einer gestörten Glukosetoleranz (IGT) handelt es sich um einen anormalen Zustand des Glukosestoffwechsels, der vom normalen Blutzuckerspiegel zu Diabetes führt. Es handelt sich um einen Prädiabetes-Zustand, der sich zu Diabetes mellitus (DM) entwickeln kann.

Um dieser Situation ein Ende zu setzen, haben Forscher des Volkskrankenhauses der Stadt Macheng in der chinesischen Provinz Hubei einen Vergleich zwischen dem logistischen Regressionsmodell (LR) und drei Modellen des maschinellen Lernens durchgeführt. Sie konnten damit die einjährige Sterberate älterer chinesischer Patienten mit koronarer Herzkrankheit in Kombination mit Diabetes oder gestörter Glukosetoleranz erfolgreich vorhersagen und so der medizinischen Gemeinschaft dabei helfen, Patienten mit kurzfristigem Sterberisiko rasch zu identifizieren und so eine Frühwarnung und Behandlung zu ermöglichen.

Die Studie wurde in der Fachzeitschrift Cardiovascular Diabetology unter dem Titel „Auf maschinellem Lernen basierende Modelle zur Vorhersage der Einjahresmortalität bei älteren chinesischen Patienten mit koronarer Herzkrankheit in Kombination mit gestörter Glukosetoleranz oder Diabetes mellitus“ veröffentlicht.

Abbildung 1: Dieses Forschungsergebnis wurde in Cardiovascular Diabetology veröffentlicht

Papieradresse:

https://cardiab.biomedcentral.com/articles/10.1186/s12933-023-01854-z

Experimentelle Verfahren 

Datensatz: Daten von 451 älteren Patienten mit koronarer Herzkrankheit aus 301 Krankenhäusern 

In dieser Studie wurden 974 ältere Patienten mit angeborenem Herzfehler analysiert, die zwischen Oktober 2007 und Juli 2011 in die Abteilung für Geriatrische Kardiologie des PLA General Hospital eingeliefert wurden.Die Forscher führten außerdem eine Untersuchung nach zwei Kriterien durch:Sie sind:

1. über 60 Jahre alt sind;

2. Leiden an einer gestörten Glukosetoleranz (IGT) oder Diabetes mellitus (DM).

Der endgültige Datensatz enthielt 451 Patienten, die zufällig im Verhältnis 7:3 in einen Trainingssatz (n = 308) und einen Testsatz (n = 143) aufgeteilt wurden.Der Trainingssatz wird zum Trainieren und Optimieren des logistischen Regressionsmodells und dreier Modelle des maschinellen Lernens verwendet, und der Testsatz wird zum Testen der Vorhersageleistung des Modells verwendet. Der Datensatz-Screening-Prozess läuft wie folgt ab:

Abbildung 2: Flussdiagramm zur Patientenauswahl und zum Studiendesign

Modellentwicklung: Auswahl von 4 Hauptmodellen für den horizontalen Vergleich 

In dieser Studie entwickelten die Forscher ein logistisches Regressionsmodell und drei Modelle für maschinelles Lernen.Die Vorhersagemodelle werden für das Gradient Boosting Machine-Modell (GBM), das Random Forest-Modell (RF) und das Decision Tree-Modell (DT) erstellt.Der Vorhersageeffekt wird anhand mehrerer Indikatoren wie Brier Score, AUC (Area Under the Curve), Kalibrierungskurve und Entscheidungskurve bewertet.

Brier-Score:Eine Möglichkeit, die Differenz zwischen der vom Algorithmus vorhergesagten Wahrscheinlichkeit und dem tatsächlichen Ergebnis zu messen. Der Wertebereich liegt zwischen 0 und 1, wobei höhere Werte auf schlechtere Vorhersagen und eine geringere Kalibrierung hinweisen.

Abbildung 3: Formel zur Berechnung des Brill-Scores

AUC:Bezieht sich auf die Fläche unter der Kurve. In der Statistik und im maschinellen Lernen wird AUC häufig verwendet, um die Leistung binärer Klassifizierungsmodelle zu bewerten. Der Wertebereich reicht von 0 bis 1. Je näher der Wert bei 1 liegt, desto besser ist die Modellleistung. Je näher der Wert bei 0,5 liegt, desto schwächer ist die Vorhersagefähigkeit des Modells.

 Feature-Screening und Parameter-Tuning für 3 Machine-Learning-Modelle 

Gleichzeitig führten die Forscher ein Feature-Screening und eine Parameteroptimierung des entwickelten maschinellen Lernmodells durch.Zunächst verwendeten sie den LASSO-Algorithmus (Least Absolute Shrinkage and Selection Operator) in Kombination mit einer 10-fachen Kreuzvalidierung, um sieben Merkmale als Modelleingaben herauszufiltern, die signifikant mit der einjährigen Sterblichkeit korrelierten. Diese sieben Merkmale waren Hämoglobin, HDL-C, Albumin, Blutkreatinin, NT-proBNP, CHF und Statine. Anschließend führten sie eine zufällige Hyperparametersuche mithilfe einer 5-fachen Kreuzvalidierung und eines Bootstrap durch, um die beste Parameterkombination zu finden und den besten Bereich unter der Kurve (AUC) zu erhalten.

Abbildung 4: Hyperparameter-Tuning-Prozess

A:LASSO-Koeffizientenkurve (Least Absolute Shrinkage and Selection Operator)

B:Die beste Parameterkombination

C:Korrelationskoeffizienten zwischen klinischen Merkmalen

Aus Abbildung 4 geht hervor, dass alle Korrelationskoeffizienten unter 0,80 liegen, was darauf hinweist, dass keine schwerwiegende Kollinearität vorliegt.Die oben genannten 7 klinischen Merkmale wurden zum Trainieren des logistischen Regressionsmodells und 3 Vorhersagemodellen für maschinelles Lernen verwendet.Nach dem Modelltraining und der Optimierung werden die optimalen Hyperparameter für jedes Modell in der folgenden Tabelle angezeigt:

Tabelle 1: Optimale Hyperparameter für jedes Modell

Experimentelle Ergebnisse 

Aus der Gesamtleistung jedes Modells:

* Der Brier-Score des logistischen Regressionsmodells (LR) beträgt 0,116

* Der Brier-Score des Gradient Boosting Machine-Modells (GBM) beträgt 0,114

* Der Brier-Score des Entscheidungsbaummodells (DT) beträgt 0,143

* Der Brier-Score des Random-Forest-Modells (RF) beträgt 0,126

Die folgende Abbildung zeigt die Analyseergebnisse jedes Modells:

Abbildung 5: AUC, Kalibrierungskurve, Entscheidungskurve und SHAP-Wert jedes Modells

D:Gesamtleistung jedes Modells

E:Kalibrierungskurven jedes Modells

F:Entscheidungskurven für jedes Modell

G:SHAP-Wert-Heatmap

H:Feature-Wichtigkeitsanalyse basierend auf SHAP

Aus Abbildung 5 lassen sich folgende Schlussfolgerungen ziehen:

1. Die AUCs der Modelle LR, GBM, DT und RF betragen 0,827, 0,836, 0,760 bzw. 0,829.

2. Die Kalibrierungskurven zeigen, dass alle Modelle gute Kalibrierungseffekte haben. Unter ihnen hat das GBM-Modell die beste Wirkung.

3. Die Entscheidungskurvenanalyse zeigte, dass sowohl das GBM-Modell als auch das LR-Modell eine gute klinische Praktikabilität aufwiesen.

4. Basierend auf dem GBM-Modell analysierten die Forscher weiter die Bedeutung signifikanter klinischer Merkmale in der gesamten Bevölkerung. Durch die Analyse sowohl der individuellen als auch der durchschnittlichen SHAP-Werte wurde festgestellt, dass die drei wichtigsten mit der einjährigen Sterblichkeit verbundenen Merkmale NT-proBNP, Albumin und Statine waren.

| FORM: Shaley Additive-Erklärung, Feature-Beitrag. Durch die Analyse des SHAP-Werts können Forscher Erklärungen für die Vorhersageergebnisse erhalten und verstehen, wie sich jedes Merkmal auf die Vorhersagen des Modells auswirkt. Auf diese Weise können sie das Verhalten des Modells besser verstehen und erklären.

Zusammenfassend kamen die Forscher zu dem Schluss, dass die Modelle früherer Studien zwar eine hohe Vorhersagekraft hatten, aufgrund zu vieler Variablen jedoch nicht für die klinische Anwendung geeignet waren. In dieser Studie nutzten die Forscher erfolgreich sieben Merkmale, um ein Modell zur Vorhersage der Einjahressterblichkeit zu entwickeln.Die Ergebnisse zeigen, dass das GBM-Modell einen AUC von bis zu 0,836 und einen Brier-Score von 0,116 aufweist und insgesamt die beste Vorhersageleistung bietet.

Es ist erwähnenswert, dass die Forscher zur weiteren Vereinfachung klinischer Anwendungen auch eine Online-Anwendung entwickelt haben, bei der die Ärzte lediglich Patientenparameter eingeben müssen, um die Sterbewahrscheinlichkeit innerhalb eines Jahres vorherzusagen. Auf diese Weise können Ärzte bei Hochrisikopatienten frühzeitig günstige Maßnahmen ergreifen, um die Überlebenswahrscheinlichkeit des Patienten zu erhöhen.

KI im medizinischen Bereich hat eine glänzende Zukunft, aber wir sollten nicht blind optimistisch sein 

Mit der fortschreitenden Reife der KI-Sprachinteraktion, der Computervision, des kognitiven Computing, des Deep Learning und anderer Technologien werden die Anwendungsszenarien der KI im medizinischen Bereich immer vielfältiger.Es umfasst mehrere Bereiche wie medizinische Bildgebung, virtuelle Assistenten, Arzneimittelentwicklung, Gesundheitsmanagement, Analyse von Krankenakten/Literatur und Krankheitsvorhersagemanagement.

Laut dem Blaubuch 2020 zur Entwicklung der Medizinbranche mit künstlicher Intelligenz der China Academy of Information and Communications Technology,Obwohl der inländische KI-Medizinbereich erst spät in Gang kam, ist die Marktnachfrage stark und die zukünftigen Entwicklungsaussichten sind vielversprechend.Unter anderem ist hervorzuheben, dass der Anteil der älteren Bevölkerung im Alter von 65 Jahren und darüber Ende 2019 im Land 12,61 TP3T erreicht hat, was bedeutet, dass China offiziell in eine alternde Gesellschaft eingetreten ist. Infolgedessen nimmt auch die Zahl chronischer Erkrankungen von Jahr zu Jahr zu.

In diesem Zusammenhang sind die in dieser Studie dargestellten Ergebnisse zur Krankheitsvorhersage entstanden, die Ärzten und Patienten wirksam dabei helfen können, ihre Gesundheit besser zu managen. Auf der anderen Seite muss man jedoch auch sehen, dass KI-bezogene Technologien angesichts der allgemeinen Marktsituation noch nicht in großem Umfang in Krankenhäusern eingesetzt werden und die Krankenhäuser nicht bereit sind, dafür zu zahlen. Dies hängt eng mit den Nutzungs- und Zahlungsgewohnheiten der Benutzer, der unterstützenden Infrastruktur wie Krankenversicherungspolicen und der hohen Komplexität klinischer Anwendungsszenarien zusammen.Daher ist es im Bereich der KI-gestützten medizinischen Versorgung noch ein weiter Weg.

Referenzlinks:

[1] https://doi.org/10.5334/gh.934

[2] https://doi.org/10.1111/1753-0407.13175

[3] https://doi.org/10.1007/s001250051352

[4] https://doi.org/10.1186/1475-2840-5-15

[5]https://rs.yiigle.com/CN112148202107/1328929.htm

[6]http://www.caict.ac.cn/kxyj/qwfb/ztbg/202009/P020200910495521359097.pdf