نُشرت في مجلة الطبيعة! اقترحت جامعة هواتشونغ للعلوم والتكنولوجيا نموذجًا لاستراتيجية اندماج الذكاء الاصطناعي لتحقيق التنبؤ الدقيق بمخاطر الوفيات الناجمة عن الصدمة الإنتانية في مراكز متعددة وعبر التخصصات

تشير الصدمة المعدية (المعروفة أيضًا باسم الصدمة الإنتانية) إلى متلازمة اضطرابات الدورة الدموية الشديدة واضطرابات التمثيل الغذائي الخلوي الناجمة عن الإنتان، والتي يمكن اعتبارها "المرحلة النهائية" لتطور الإنتان في المظاهر السريرية. تتمتع الصدمة الإنتانية بمعدل وفيات مرتفع للغاية وهي حاليًا واحدة من أكثر الأمراض فتكًا في وحدات العناية المركزة.وبحسب تقرير بحثي يعتمد على قاعدة بيانات العناية المركزة الوطنية في المملكة المتحدة، فإن معدل الوفيات في المستشفى بين المرضى المصابين بالصدمة الإنتانية يمكن أن يصل إلى 55.5%.
في مواجهة هذا المرض المتقدم ذو معدل الوفيات المرتفع، فإن التركيز السريري على الصدمة الإنتانية هو "الوقت هو الحياة"، ويتم الترويج للاكتشاف المبكر والتدخل المبكر والعلاج المبكر لتقليل معدل الوفيات. لكن،ونظرا لتعقيد حالة مرضى الصدمة الإنتانية وندرة البيانات الطبية السريرية، فمن الصعب للغاية توفير إنذار مبكر حول تطور حالة مرضى الصدمة الإنتانية.، وهو أيضًا العائق الرئيسي أمام التدخل الفعال لمنع تدهور حالة الإنتان إلى الصدمة الإنتانية.
في الوقت الحاضر، ومع تعميق تكنولوجيا المعلومات في طب الرعاية الحرجة، فإن التكامل المتبادل بين الذكاء الاصطناعي وطب الرعاية الحرجة جعل الإنذار المبكر من الإنتان لم يعد صعبًا، لكن الأبحاث حول الصدمة الإنتانية تأخرت. ويرجع ذلك إلى أن معظم الدراسات تعتمد على أحجام عينات صغيرة، وتعتمد على خوارزمية واحدة للتعلم الآلي، وقد فشلت في اجتياز التحقق من صحة المراكز المتعددة، مما يجعل من الصعب ترقيتها إلى الممارسة السريرية للتنبؤ المبكر بالمخاطر لدى المرضى الذين يعانون من الصدمة الإنتانية.
وفي ضوء ذلك، قام البروفيسور يي تشينغ من مستشفى تونغجي التابع لكلية تونغجي الطبية بجامعة هواتشونغ للعلوم والتكنولوجيا والبروفيسور وو هونغ من كلية الإدارة الطبية والصحية بتطوير نموذج دمج التصنيف (TCF) القائم على TOPSIS (تقنية تفضيل الطلب عن طريق التشابه مع الحل المثالي) للتنبؤ بخطر الوفاة في غضون 28 يومًا لدى المرضى الذين يعانون من الصدمة الإنتانية في وحدة العناية المركزة.يدمج النموذج 7 نماذج للتعلم الآلي ويتمتع بثبات ودقة عالية في التحقق عبر المهن ومتعدد المراكز.ويوفر للأطباء أداة مساعدة موثوقة للتحذير المبكر من خطر الوفاة بسبب الصدمة الإنتانية.
نُشرت نتائج البحث في مجلة npj Digital Medicine الفرعية التابعة لمجلة Nature تحت عنوان "نماذج التنبؤ بالوفيات متعددة التخصصات القائمة على الذكاء الاصطناعي للصدمة الإنتانية في دراسة استرجاعية متعددة المراكز".
أبرز الأبحاث:
* اعتمدت الدراسة استراتيجية اندماج فعالة لبناء نموذج اندماجي يتمتع بقدرة تعميم عالية ومتانة استنادًا إلى نماذج تصنيف أساسية متعددة، متغلبًا على مشكلة ضعف أداء مجموعات العينات الصغيرة ونماذج التصنيف الفردية في السيناريوهات السريرية
* لقد حققت نتائج البحث تقدمًا كبيرًا في صعوبة التنبؤ بخطر الوفاة المبكرة في الصدمة الإنتانية، مما يوفر للأطباء أداة فعالة ومستقرة وموثوقة لاتخاذ القرارات السريرية تساعد الأطباء على مراقبة تقدم حالات المرضى عن كثب في وقت مبكر واتخاذ تدابير علاجية أكثر نشاطًا.

عنوان الورقة:
https://go.hyper.ai/faMLL
يجمع المشروع المفتوح المصدر "awesome-ai4s" أكثر من مائة تفسير ورقي لـ AI4S ويوفر مجموعات وأدوات ضخمة من البيانات:
https://github.com/hyperai/awesome-ai4s
مجموعات البيانات: بيانات واسعة النطاق، معالجة دقيقة
من أجل بناء نموذج للتنبؤ بالصدمة الإنتانية ذو قابلية تطبيق واسعة،قام فريق البحث بدمج البيانات السريرية لـ 4872 مريضًا مصابًا بالصدمة الإنتانية في وحدة العناية المركزة من ثلاثة مستشفيات من فبراير 2003 إلى نوفمبر 2023.إن خلفيات المشاركين معقدة ومتنوعة، مما سيساعد فريق البحث على إجراء التحقق في مراكز متعددة وتخصصات مختلفة لإثبات صحة النموذج وقابليته للتطبيق. كما هو موضح في الشكل التالي:

خاصة،شملت المجموعة الأولى 4189 مشاركًا.ومن بينهم 3451 مريضا في العناية المركزة العامة (721 إيجابية و2730 سلبية)؛ 357 مريضًا في وحدة العناية المركزة للأطفال (المجموعة 1-1) (52 إيجابية)؛ و381 مريضًا في العناية المركزة التنفسية (المجموعة 1-2) (60 إيجابيًا).
* النتائج الإيجابية هي للمشاركين الذين عانوا من الوفاة لأي سبب خلال 28 يومًا من دخولهم وحدة العناية المركزة، ويتم وضع علامة على المشاركين الذين لم يعانوا من الوفاة لأي سبب على أنهم نتائج سلبية (نفس النتائج أدناه)
ومن بينها، تم استخدام مجموعة بيانات مرضى وحدة العناية المركزة العامة باعتبارها المجموعة السكانية الرئيسية للبحث ولبناء النموذج والتحقق الداخلي.تم تقسيم بيانات التدريب وبيانات التحقق بنسبة 8:2، مع 2760 موضوعًا (577 إيجابيًا) و691 موضوعًا (144 إيجابيًا) على التوالي.وقد قامت مجموعات البيانات الخاصة بمرضى وحدة العناية المركزة للأطفال ومرضى وحدة العناية المركزة التنفسية بتقييم مدى قابلية تطبيق النموذج واستقراره في وحدات العناية المركزة المتخصصة المختلفة.
وشملت المجموعة الثانية والثالثة مرضى مصابين بصدمة إنتانية من وحدات العناية المركزة المختلفة، مع 422 مشاركًا (100 إيجابي، 322 سلبي) و261 مشاركًا (75 إيجابي، 186 سلبي) على التوالي.يتم استخدام هذين الجزأين من مجموعة البيانات بشكل أساسي للتحقق الخارجي لتقييم قدرتها على التعميم وفعاليتها في مراكز مختلفة.
بالإضافة إلى ذلك، من أجل الحصول على نتائج تجريبية دقيقة،قام فريق البحث باستخراج 93 سمة سريرية مشتركة.بما في ذلك المعلومات الديموغرافية، وتاريخ المرض والعلاج، ومعلومات العلامات الحيوية، وما إلى ذلك، تم تحسينها في النهاية إلى 34 عنصرًا للتجربة.
خاصة،تتكون معالجة البيانات المسبقة من 5 أجزاء:في الخطوة الأولى، قام فريق البحث أولاً بحساب معدل الفقد وحذف 23 متغيرًا بمعدلات فقد أعلى من 30%؛ في الخطوة الثانية، تم حساب تباين الميزات المنطقية وفقًا لصيغة تباين برنولي، وتم إزالة المتغيرات العشوائية المنفصلة ذات الاتساق الذي يتجاوز 90% مرة أخرى؛ وفي الخطوة الثالثة، تم استخدام أسلوب الاستيفاء بالقيمة المفقودة (الاستيفاء المتعدد للانحدار اللوجستي) لمزيد من التحسين لـ 61 متغيرًا؛ وفي الخطوة الرابعة تم فحص السمات ذات الارتباط العالي مرة أخرى (معامل ارتباط بيرسون ≥ 0.7)، وتبقى 50 متغيرًا في هذا الوقت. كما هو موضح في الشكل التالي:

وفي الخطوة الخامسة، قام الباحثون بفرز المتغيرات وفقًا لإنتروبيا المعلومات (من الأعلى إلى الأدنى) وفي النهاية اختاروا 34 متغيرًا رئيسيًا للتجربة، بما في ذلك عوامل مهمة مثل العمر والتاريخ الجراحي ودرجة حرارة الجسم وضغط الدم الانبساطي.

تجدر الإشارة إلى أنه من أجل حماية خصوصية المشاركين، تم إخفاء هوية جميع البيانات قبل التحليل.
هندسة النموذج: نموذج الاندماج والتنبؤ الدقيق
ينقسم البحث في نموذج TCF بشكل أساسي إلى ثلاث خطوات:تتمثل الخطوة الأولى في إنشاء 7 نماذج فرعية باستخدام بيانات دخول المرضى إلى المستشفى بسبب الصدمة الإنتانية، حيث ينتج كل منها نتائج لـ 6 مؤشرات تقييم؛ الخطوة الثانية هي دمج النماذج الفرعية في نموذج الاندماج بناءً على استراتيجية الاندماج والتحقق من تفوق النموذج على النماذج الأخرى؛ تتضمن الخطوة الثالثة إجراء اختبار عبر مجموعات بيانات مختلفة للتحقق من أداء النموذج وإجراء تحليل قابلية التفسير على النموذج (كما هو موضح في قسم النتائج التجريبية).

خاصة،في الخطوة الأولى، قام فريق البحث أولاً بتدريب واختبار 7 نماذج فرعية باستخدام مجموعة بيانات وحدة العناية المركزة المشتركة المعالجة بالميزات.تم تطبيق تقنية أخذ العينات المفرطة للأقلية الاصطناعية (SMOTE) على مجموعة التدريب وفقًا لقاعدة 1:1 لتخفيف التأثير السلبي لعدم التوازن في الفئات. بعد التطبيع الأدنى والأقصى، تم تحديد مجموعة المعلمات المثلى من خلال التحقق المتبادل الخماسي والبحث العشوائي، وتم تدريب 7 نماذج فرعية على مجموعة التدريب، وهي شجرة القرار (DT)، والغابة العشوائية (RF)، وXGBoost (XGB)، وLightGBM (LGBM)، وNaive Bayes (NB)، وآلة الدعم المتجه (SVM)، وشجرة القرار المعززة بالتدرج (GBDT).
وأخيرا، استخدم فريق البحث بيانات التحقق الداخلية للتحقق من نتائج الاختبار.يتم تقييم أداء النموذج باستخدام 6 مؤشرات تقييم.وهي المساحة تحت منحنى ROC (AUC)، ودرجة F1، والدقة (PRE)، والضبط (ACC)، والحساسية (SEN)، والنوعية (SPE).
وفي الخطوة الثانية، قام فريق البحث بدمج هذه النماذج الفرعية السبعة، ولكل منها مزاياها وعيوبها.تم تصميم نموذج تصنيف اندماجي يعتمد على TOPSIS TCF لدمج نتائج تقييم سبعة نماذج لتوفير نتيجة تنبؤ شاملة لتشخيص الصدمة الإنتانية. تم حساب أوزان النماذج الفرعية بواسطة درجة TOPSIS، وكان احتمال التنبؤ المرجح هو احتمال التنبؤ بـ TCF. تم استخلاص نتائج تصنيف TCF مع اعتبار 0.5 قيمة حرجة.
خوارزمية دمج نموذج TCF المحددة هي كما يلي:

من حيث التحليل الإحصائي، بالنسبة للميزات المستمرة، يتم إعطاء إحصائيات المتوسط والربع العلوي والربع السفلي؛ بالنسبة للميزات المنفصلة، يتم الإبلاغ عن نسبة كل فئة.في هذه الدراسة، أصغر مجموعة بيانات هي المجموعة 3، ووفقًا لنظرية الحد المركزي، يمكن اعتبار متوسط توزيع الميزات المستمرة توزيعًا طبيعيًا.
ثم،استخدمت الدراسة اختبار ليفين لتحديد تجانس الخصائص بين مجموعتين من البيانات.تم استخدام اختبار مربع كاي لمقارنة الاختلافات في الميزات المنفصلة بين البيانات الأخرى ومجموعة التحقق الداخلي، وتم اختبار الاختلافات في الميزات المستمرة باستخدام اختبار t للعينة المستقلة أو اختبار t لـ Welch، وتم استخدام 1000 عينة تمهيدية لحساب فترات الثقة 95% لمؤشرات التقييم.
ومن أجل الحصول على فهم أعمق لعملية التفكير في النموذج، قام فريق البحث أيضًا بتصور أهمية الميزة من خلال رسم خريطة حرارية لأهمية ميزة SHAP. خذ نموذج GBDT مع أفضل أداء AUC كمثال، كما هو موضح في الشكل التالي:

إن تصنيف أهمية الميزة لا يمكن أن يؤدي فقط إلى تحسين الشفافية والمصداقية لنماذج التنبؤ السريري، بل يوفر أيضًا مرجعًا قيمًا للممارسة الطبية. بهذه الطريقة،لا يلبي النموذج طلب الأطباء للشفافية النموذجية فحسب، بل يقيس أيضًا الفائدة السريرية الصافية.ويحقق القدرة على التفسير السريري والتطبيق العملي، مما يضع الأساس لتطبيق النموذج في الممارسة السريرية.
النتائج التجريبية: التحقق متعدد الأبعاد، موثوق وسهل الاستخدام
ولتحقق من أداء نموذج الاندماج (TCF)، قام فريق البحث أولاً بمقارنته بالنماذج الفرعية. وتظهر النتائج في الشكل أدناه:

يتفوق TCF على النماذج الفرعية في مؤشرات التقييم الشاملة على مجموعة التحقق الداخلي.AUC هو 0.733 ودرجة F1 هي 0.458. بالإضافة إلى ذلك، فإن ACC البالغة 0.686 وPRE البالغة 0.358 أعلى أيضًا من معظم النماذج الفرعية. وهذا يدل على قدرتها الممتازة على التصنيف.

على الرغم من أن درجات نموذج TCF على SEN و SPE ليست جيدة مثل أفضل أداء، والتي تبلغ 0.640 و 0.700 على التوالي،ولكن يمكنه تحديد التأثير من خلال انحراف النموذج الفرعي بأكمله، وبالتالي تحقيق أفضل أداء إجمالي.كما هو موضح في الشكل أدناه.


يُظهر منحنى المعايرة ومنحنى تحليل منحنى القرار (DCA) أن النتائج المتوقعة لنموذج TCF تتفق مع النتائج الفعلية.أولاً، منحنى المعايرة لنموذج TCF هو الأقرب إلى الخط القطري، مما يشير إلى أنه يتمتع بأفضل أداء معايرة بين جميع النماذج. ثانياً، يكون منحنى نموذج TCF دائماً أفضل من استراتيجيات "الكل" و"لا شيء" في معظم الاحتمالات العتبية، وخاصة في نطاق الاحتمالات من 0.1 إلى 0.5، مما يدل على عوائد صافية أعلى. ويشير هذا إلى أن نموذج TCF يتمتع بقيمة تطبيق سريري محتملة ضمن نطاق معين ويمكن أن يساعد الأطباء على اتخاذ قرارات أكثر ملاءمة.
ثم أجرى فريق البحث عملية تحقق متعددة المراكز، والتي يمكن أن توضح بشكل أكثر دقة الأداء التنبئي لنموذج TCF والتباين بين مجموعات البيانات المختلفة. كما هو موضح في الشكل التالي:

يمكن ملاحظة أنه على عكس معظم الدراسات حيث يكون تأثير التنبؤ متعدد المراكز أقل قليلاً من تأثير مجموعة التدريب ومجموعة التحقق الداخلي، في هذه الدراسة، باستثناء انخفاض طفيف في AUC (0.662) للمجموعة 1-2 (مجموعة بيانات مرضى وحدة العناية المركزة التنفسية)،تحسنت جميع قيم AUC في المجموعة 1-1 (مجموعة بيانات مرضى وحدة العناية المركزة للأطفال)، والمجموعة 2، والمجموعة 3.وهي 0.808 و 0.784 و 0.786 على التوالي.
بالإضافة إلى ذلك، نظرًا للعدد المحدود من العينات متعددة المراكز،قام فريق البحث بدمج 4 مجموعات بيانات خارجية للتحقق من الصحة بشكل خاص للتنبؤ (1421 بيانات مريض، بما في ذلك 287 حالة إيجابية).بلغت المساحة تحت المنحنى 0.7705، مما يشير إلى أن نموذج TCF يمكنه التمييز بشكل فعال بين المرضى الذين لديهم عوامل خطر منخفضة للإصابة بالصدمة الإنتانية ولديه قدرة معايرة جيدة.

ومن بينها، أ هو الرسم البياني لصندوق AUC؛ ب هو الرسم البياني لصندوق ACC؛ ج هو الرسم البياني لصندوق SPE؛ d هو رسم بياني لصندوق النتيجة F1؛ e هو الرسم البياني لصندوق PRE؛ و f هو رسم بياني لصندوق SEN. يشير الخط الرمادي المتقطع إلى النتائج في مجموعة التحقق الداخلي، وتقع درجات التقييم في مجموعات البيانات الأخرى ضمن المنطقة الرمادية الداكنة، مما يشير إلى انخفاض في الأداء مقارنة بمجموعة التحقق الداخلي.
باختصار، حقق نموذج TCF أداءً ثابتًا وجيدًا على كل من مجموعة البيانات الداخلية ومجموعة التحقق الخارجية، مما أظهر أداءً متفوقًا على النماذج الفردية في التنبؤ بخطر الوفاة في غضون 28 يومًا لدى المرضى المصابين بالصدمة الإنتانية.يوفر هذا النموذج لأطباء وحدة العناية المركزة أداة تنبؤ موثوقة وسهلة الاستخدام، خاصة في المراحل المبكرة الحرجة من تدهور حالة المريض. ويمكنه مساعدة الأطباء بشكل فعال في تقديم تدخلات علاجية فعالة وشخصية لمرضى مختلفين وتحسين تشخيص المرضى.
يلعب الذكاء الاصطناعي دورًا كبيرًا في علاج الإنتان/الصدمة الإنتانية
مع التطور المستمر للعلوم والتكنولوجيا، أصبح التكامل المتبادل بين الذكاء الاصطناعي وطب الرعاية الحرجة منذ فترة طويلة مجالًا يثير قلقًا كبيرًا لدى الباحثين المعنيين. لا شك أن هذه الدراسة تمثل استكشافًا ذا قيمة رائدة. وكما ذكرنا آنفاً، فإن الإنتان/الصدمة الإنتانية هي أزمة صحية عامة عالمية ذات معدلات وفيات ومرضية مرتفعة، وهناك حاجة ماسة إلى الكشف المبكر والتدخل لتحسين معدل بقاء المرضى على قيد الحياة.
في الماضي، ازدهرت الأبحاث حول نماذج الإنذار المبكر لمرض الإنتان، وقدمت العديد من المختبرات نتائج أبحاث ذات صلة.
على سبيل المثال، دراسة بعنوان "التعلم الآلي للكشف المبكر عن الإنتان: دراسة للتحقق الداخلي والزمني" نشرها أرماندو دي بيدويا وآخرون. من جامعة ديوك في الولايات المتحدة.يقدم ويتحقق نموذج التنبؤ MGP-RNN القائم على التعلم العميق (عملية غاوسية متعددة المخرجات والشبكة العصبية المتكررة).وبالمقارنة مع ثلاث طرق للتعلم الآلي بما في ذلك الغابة العشوائية، وانحدار كوكس، والانحدار اللوجستي المعاقب، بالإضافة إلى ثلاث درجات سريرية، تفوق النموذج على النماذج الأخرى والدرجات السريرية في جميع المؤشرات ويمكنه اكتشاف الإنتان قبل 5 ساعات.
عنوان الورقة:
https://pmc.ncbi.nlm.nih.gov/articles/PMC7382639
بالإضافة إلى ذلك، قدم فريق من شركة كاليفورنيا المسماة Dascena أيضًا رؤاهم في دراسة باستخدام أسلوب البحث بأثر رجعي.باستخدام بيانات من 32000 مريض في قاعدة بيانات MIMIC II السريرية، تم تطوير خوارزمية تحذير مبكر للإنتان تسمى InSight من خلال ربط تسعة قياسات شائعة للعلامات الحيوية.وأظهرت النتائج أن الخوارزمية تتمتع بحساسية 0.90 وخصوصية 0.81 في التنبؤ بالإنتان قبل 3 ساعات من ظهور متلازمة الاستجابة الالتهابية الجهازية المستمرة (SIRS)، متفوقة على طرق الكشف عن المؤشرات الحيوية الحالية. نُشر البحث تحت عنوان "نهج حسابي للكشف المبكر عن الإنتان".
عنوان الورقة:
https://www.sciencedirect.com/science/article/abs/pii/S0010482516301123?via%3Dihub
لقد جعل دمج الذكاء الاصطناعي وطب الرعاية الحرجة من الإنذار المبكر لمرض الإنتان غير صعب بعد الآن، ولا شك أن هذه الدراسة تملأ فجوة عدم وجود تحذير في الوقت المناسب عندما يتطور مرض الإنتان إلى مرحلة حرجة، وهي استكشاف ذو قيمة طبية أكبر. وبالطبع، فإن ما هو أكثر أهمية هو استراتيجية الاندماج المذكورة في هذه الدراسة، والتي تعمل على تحسين الأداء العام للنموذج بأكمله من خلال موازنة مزايا الحساسية والنوعية للنماذج الفرعية. ويمهد هذا الطريق لحل المشاكل ذات الصلة من خلال التكامل بين النماذج المتعددة في المستقبل، ويشجع على إجراء المزيد من الأبحاث لحل الصعوبات العملية في السيناريوهات الطبية من خلال أساليب مماثلة.