HyperAI

حل مشكلة "الصندوق الأسود" في التنبؤ بالسلاسل الزمنية! اقترحت جامعة هواتشونغ للعلوم والتكنولوجيا قناع CGS للكشف عن المؤشرات الرئيسية لمعدل بقاء المريض على قيد الحياة

特色图像

مع التطبيق الواسع النطاق لتكنولوجيا الذكاء الاصطناعي في حياتنا اليومية،لقد أصبحت "قابلية تفسير" النموذج تدريجيا قضية تحتاج إلى معالجة.وخاصة عندما يتعلق الأمر بالمهام التي تنطوي على حياة الإنسان وسلامة الممتلكات، فإن خوارزمية "الصندوق الأسود" هذه لا تقوض ثقة المستخدمين في أنظمة الذكاء الاصطناعي فحسب، بل تتسبب أيضًا في سلسلة من المشاكل، مثل السلامة والتمييز.

تبرز هذه المشكلة بشكل خاص في مهام التنبؤ بالسلاسل الزمنية.تتضمن عملية التنبؤ بالسلاسل الزمنية العديد من الصناعات الرئيسية، بما في ذلك على سبيل المثال لا الحصر التنبؤ بسوق الأسهم، والتنبؤ بالأمراض، والتنبؤ بالطاقة، والتنبؤ بالطقس، وما إلى ذلك. وفي المهام في هذه المجالات، من الضروري فهم الأسباب وراء قرارات الذكاء الاصطناعي.إذا أخذنا التنبؤ بالمرض كمثال، فإن الأطباء والمرضى لا يحتاجون فقط إلى معرفة نتائج التنبؤ بالذكاء الاصطناعي، بل يحتاجون أيضًا إلى فهم كيفية الحصول على هذه النتائج. وإذا تمكنوا من الإشارة بوضوح إلى الأعراض التي تلعب دورًا رئيسيًا في التشخيص، فسوف يعزز ذلك ثقة الأطباء والمرضى في التشخيص الطبي بمساعدة الذكاء الاصطناعي.

من أجل جعل التنبؤ بالسلسلة الزمنية ليس مجرد رقم دقيق، بل عملية "مرئية"،واقترح فريق لو فنغ من جامعة هواتشونغ للعلوم والتكنولوجيا، بالتعاون مع فريق زومايا من جامعة سيدني ومستشفى تونغجي، طريقة جديدة وهي قناع CGS.من خلال الجمع بين التنبؤ بالسلاسل الزمنية والقدرة على التفسير، لا تستطيع هذه الطريقة تحسين دقة التنبؤ بالنموذج فحسب، بل تجعل نتائج التنبؤ أكثر سهولة في الفهم وقابلية للتفسير أيضًا.

على وجه التحديد، من خلال تقديم آلية إخفاء، يمكن للنموذج تسليط الضوء على اللحظات والبيانات التي لها التأثير الأكبر على النتيجة النهائية، تمامًا مثل تحديد العلامات المهمة على الطريق بوضوح لك أثناء القيادة، حتى تفهم سبب اتخاذك قرار الانعطاف أو التباطؤ.يتمتع هذا النهج بإمكانيات تطبيقية واسعة في مجالات مثل الرعاية الصحية، وعلم الفلك، وأجهزة الاستشعار، والطاقة، وخاصة في مهام التنبؤ بالسلاسل الزمنية التي تتطلب التفاعل مع المستخدمين.

تم قبول هذا الإنجاز، المعنون "CGS-Mask: جعل التنبؤات بالسلاسل الزمنية بديهية للجميع"، للنشر في وقائع مؤتمر AAAI الثامن والثلاثين حول الذكاء الاصطناعي (AAAI'24)، أحد أهم مؤتمرات الذكاء الاصطناعي في العالم.

أبرز الأبحاث:

* بالمقارنة مع الطرق التقليدية، يمكن لـ CGS-Mask أن يوضح بشكل أكثر وضوحًا الفترات الزمنية الأكثر أهمية لنتائج التنبؤ والعوامل غير المهمة، مما يجعل من الأسهل على المستخدمين فهم عملية التنبؤ

* CGS-Mask مناسب لمهام التنبؤ بالسلاسل الزمنية المختلفة، وخاصة تلك التي تتطلب تفاعل المستخدم وشرح النتائج، مثل التنبؤ بسوق الأوراق المالية، والتنبؤ بالأمراض، والتنبؤ بالطقس.

* يتفوق CGS-Mask على الطرق الأخرى من حيث الدقة والقدرة على التفسير والبديهية. إنه يقلل من مشكلة "الصندوق الأسود" ويحسن شفافية النموذج. ومن خلال هذه الطريقة، يمكن أيضًا لغير المتخصصين فهم نتائج التنبؤ بالنموذج، وهو ما يعد أكثر سهولة في الاستخدام ويعزز قابلية تطبيق النموذج ومصداقيته.

* في المستقبل، سيعمل الباحثون بشكل نشط على تعزيز CGS-Mask والعمل على إثبات إمكانية تطبيق CGS-Mask في المزيد من تطبيقات السلاسل الزمنية، وخاصة في مجال الرعاية الصحية، حيث يمكن استخدام الطريقة لتحديد السمات المهمة من السجلات الطبية للكشف عن بداية وتطور وتدهور الأمراض.

عنوان الورقة:

https://ojs.aaai.org/index.php/AAAI/article/view/29325

اتبع الحساب الرسمي ورد على "توقعات السلاسل الزمنية" للحصول على ملف PDF كامل

يجمع المشروع المفتوح المصدر "awesome-ai4s" أكثر من مائة تفسير ورقي لـ AI4S ويوفر مجموعات وأدوات ضخمة من البيانات:

https://github.com/hyperai/awesome-ai4s

مجموعات البيانات: بيانات اصطناعية + بيانات واقعية، تغطي الرعاية الصحية وعلم الفلك وأجهزة الاستشعار والطاقة

قام الباحثون باختيار أربع مجموعات بيانات اصطناعية:وهي "الميزات النادرة"، و"الوقت النادر"، و"الخليط"، و"العشوائي" على التوالي.

* تحتوي مجموعات البيانات الخاصة بالميزات النادرة والوقت النادر على عدد صغير من الميزات المهمة وعدد صغير من النقاط الزمنية المهمة، على التوالي. 

* يتم إنشاء مجموعة البيانات المختلطة من خلال الجمع بين الميزات النادرة والوقت النادر

* عشوائي يتم تحديد مواقع مناطق الإدخال البارزة لمجموعة البيانات بشكل عشوائي

تتضمن مجموعات البيانات الواقعية التي اختارها الباحثون ما يلي: مجموعة بيانات MIMIC-III، ومجموعة بيانات LSST، ومجموعة بيانات NATOPS، ومجموعة بيانات AE.وتغطي مجموعات البيانات هذه مجالات مثل الرعاية الصحية وعلم الفلك وأجهزة الاستشعار والطاقة، ويتم استخدامها لتقييم أداء CGS-Mask في مجالات مختلفة.

مجموعة بيانات MIMIC-III:يحتوي على سجلات صحية لـ 40 ألف مريض في وحدة العناية المركزة (ICU)، كل منها يحتوي على 31 ميزة تستخدم للتنبؤ بمعدل بقاء المريض على قيد الحياة خلال الـ 48 ساعة القادمة. هذه مهمة تصنيف ثنائية حيث الهدف هو التمييز بين ما إذا كان المريض سيبقى على قيد الحياة أو سيموت.

مجموعة بيانات LSST:محاكاة بيانات السلسلة الزمنية الفلكية استعدادًا للملاحظات باستخدام تلسكوب المسح السينوبتيكي الكبير. ويحتاج نموذج التنبؤ إلى تصنيف هذه البيانات إلى 14 فئة فلكية مختلفة.

مجموعة بيانات NATOPS:يتم إنشاؤه بواسطة أجهزة استشعار التعرف على الإيماءات، وتسجيل بيانات المستشعر من اليد، والكوع، والمعصم، والإبهام. يجب تصنيف هذه البيانات إلى 6 إيماءات مختلفة.

مجموعة بيانات AE:يتم استخدام مجموعة بيانات التنبؤ بطاقة الأجهزة المنزلية من مستودع UCI للتنبؤ بإجمالي استخدام الطاقة في المنزل. هذه مهمة انحدار، ومخرجات نموذج التنبؤ عبارة عن قيمة عددية تمثل إجمالي استخدام الطاقة.

هندسة النموذج: تحسين أقنعة الشريط، يوفر CGS-Mask تفسيرات واضحة وبديهية لتوقعات السلاسل الزمنية

CGS-Mask هي طريقة بروز تعتمد على قناع الشريط الجيني الخلوي. من خلال الجمع بين خوارزمية الجينات الخلوية لتحسين قناع الشريط، يمكن حل مشكلة "الصندوق الأسود" في مهام التنبؤ بالسلسلة الزمنية وتحسين قابلية تفسير النموذج.

* يأخذ قناع الشريط في الاعتبار خطوات الوقت المتتالية ككل لتقييم تأثير الميزات، مما يمكنه من التقاط الاعتماد الزمني لبيانات السلسلة الزمنية بشكل فعال؛ تعمل القيمة الثنائية (0 أو 1) لقناع الشريط على تعزيز إمكانية تفسير النتائج وتجعل درجة الأهمية أكثر سهولة.

الخطوات المحددة لتحسين قناع الشريط هي كما يلي: أولاً، قم بإنشاء مجموعة من أقنعة الشريط وقم بربطها بالأتمتة الخلوية؛ ومن ثم، قم بتحسين كل قناع باستخدام العمليات الجينية (مثل التقاطع والطفرة والترجمة) لتطويره إلى الجيل التالي؛ بعد N جولة من الأجيال، سيتم اختيار القناع ذو أعلى قيمة لياقة بدنية باعتباره القناع الأمثل. يظهر الإطار العام لـ CGS-Mask في الشكل أدناه:

الإطار العام لـ CGS-Mask

تهيئة السكان:يتم تهيئة مجموعة من أقنعة الشريط بشكل عشوائي ويتم تعيين هذه الأقنعة في أتمتة خلوية ثنائية الأبعاد.

تقييم اللياقة البدنية:يتم حساب قيمة اللياقة البدنية لكل قناع شريط وتقييمها من خلال خطأ اضطراب محدد، والذي يقيس تأثير القناع على تنبؤات النموذج.

تحسين المشغل الجيني: يتم تحسين كل قناع باستخدام المشغلات الجينية مثل التقاطع والطفرة والترجمة.

* التقاطع: تقوم الخوارزمية بإجراء عملية تقاطع بين أقنعة الجوار لتوليد قناع جديد. في CGS-Mask، تعتبر الخطوط الوحدة الأساسية للعمليات الجينية. يمكن وراثة خطوط القناع الجديد من أي من الوالدين.

* الطفرة: زيادة التنوع الجيني عن طريق استبدال الخطوط في القناع باحتمالية معينة ومنع الخوارزمية من التقارب إلى الحل الأمثل المحلي في وقت مبكر جدًا.

* الترجمة: اضبط إزاحة موضع الشريط على الجدول الزمني لتحسين قناع الشريط. يساعد هذا في ضبط موضع النطاقات بحيث تتم محاذاتها بشكل أكثر دقة مع المناطق البارزة الحقيقية في بيانات الإدخال.

التطور التكراري:من خلال تطبيق العوامل الوراثية المذكورة أعلاه بشكل متكرر، تتطور الأقنعة في السكان بشكل مستمر للعثور على أقنعة ذات قيم لياقة بدنية أعلى.

اختر القناع الأمثل:بعد N جولة من التكرارات، يتم اختيار القناع ذو أعلى قيمة لياقة بدنية باعتباره القناع الأمثل (القناع الأمثل M*).

من خلال الجمع بين الأتمتة الخلوية والخوارزميات الجينية، يتمكن CGS-Mask من تحسين أقنعة الشريط بشكل فعال لتوفير تفسير واضح وبديهي لتوقعات السلاسل الزمنية. لا تتطلب هذه الطريقة معلومات داخلية عن النموذج، وبالتالي فهي قابلة للتطبيق على نماذج الصندوق الأسود المختلفة ويمكنها تزويد المستخدمين بتفسيرات مفيدة بسرعة.

الاستنتاج التجريبي: يمكن لقناع CGS تحديد السمات المهمة التي تتغير بمرور الوقت بشكل فعال والكشف عن العوامل الرئيسية في تطور المرض وتدهوره

لتقييم أداء طريقة CGS-Mask، قارنها الباحثون بثمانية طرق أخرى متطورة لقياس الأهمية على مجموعات البيانات الاصطناعية والواقعية. تتضمن هذه الأساليب Dynamask، وDeepLIFT، وRISE، وFIT، وShapley Value Sampling (SVS)، وFeature Occlusion (FO)، وFeature Permutation (FP)، وIntegrated Gradient (IG). كما هو موضح في الشكل أدناه،تظهر النتائج التجريبية أن CGS-Mask يظهر دقة أعلى في تحديد الميزات البارزة، مما يشير إلى أنه أكثر فعالية في تحديد الميزات البارزة التي تتغير بمرور الوقت.

نتائج المقارنة على مجموعات البيانات في العالم الحقيقي

وباستخدام التطبيق في مجال الرعاية الصحية كمثال، اختار الباحثون مجموعة بيانات MIMIC-III للتنبؤ بمعدل بقاء المريض على قيد الحياة خلال الـ48 ساعة القادمة. ويظهر في الشكل التالي مقارنة بين الطرق المختلفة. الشكل f هو نتيجة التنبؤ بقناع CGS. يشير الشريط الأخضر إلى الميزات الرئيسية المتعلقة بنتائج المريض.توصلت الدراسات إلى أن انخفاض ضغط الدم، وتسارع دقات القلب، وضيق التنفس، كلها تشير إلى خطر الموت الوشيك، ويمكن للأطباء التدخل في الوقت المناسب بناءً على هذه الخصائص.ومع ذلك، فإن الطرق المقارنة الأخرى لا تحدد بوضوح الفترة والميزات التي تؤدي إلى هذه النتيجة، كما هو موضح في الشكلين (أ) - (د).

لتقييم قابلية قراءة الأقنعة المولدة، قام الباحثون باستطلاع آراء 254 مشاركًا من فئات عمرية مختلفة (5-83 عامًا) ومستويات مختلفة من المعرفة بالمجال. وتظهر النتائج أنقام أكثر من 651 مستخدمًا لـTP3T بتقييم CGS-Mask باعتباره الطريقة التي ساعدتهم بشكل أفضل في فهم الميزات البارزة وارتباطاتها الزمنية، وقام أكثر من 851 مستخدمًا لـTP3T بتصنيفه ضمن أفضل 3 طرق.

بالإضافة إلى ذلك، أجرى الباحثون دراسة تجريبية للمستخدم لتقييم وقت رد الفعل وأهمية الميزة والدقة عند تحديد أربع ميزات (أ، ب، ج، د) في غضون 10 خطوات زمنية باستخدام ثلاثة أقنعة أهمية (Q1، Q2، وQ3). كما هو موضح في الشكل أدناه، فإن متوسط وقت رد الفعل للمستخدمين الذين يستخدمون قناع CGS (Q2) هو 6.26 ثانية ودقة 85.4 %، في حين أن متوسط وقت رد الفعل للمستخدمين الذين يستخدمون الأقنعة الرقمية (Q1 و Q3) هو 19.22 ثانية ودقة 40.6% فقط.يشير هذا إلى أن CGS-Mask يمكن أن يساعد المستخدمين في تحديد أهمية الميزة بشكل أسرع وبدقة أعلى.

وقت استجابة المستخدم ونتائج الاختيار

باختصار، CGS-Mask، كطريقة بروز مستقلة عن النموذج، ليس بديهيًا وسهل الاستخدام فحسب، بل يمكنه أيضًا شرح توقعات السلاسل الزمنية بشكل فعال. إنه يتفوق على الحلول الحالية على البيانات الاصطناعية والواقعية.لقد أثبت CGS-Mask، وخاصة في المجال الطبي، قدرة ممتازة في تحديد السمات المهمة في السجلات الطبية، وهو أمر ذو أهمية كبيرة في الكشف عن حدوث الأمراض وتطورها وتدهورها وله إمكانات تطبيقية كبيرة.

التطبيقات المتطورة لنماذج التنبؤ بالسلاسل الزمنية في المجال الطبي

التنبؤ بالسلاسل الزمنية هو تحليل البيانات باستخدام تسلسل زمني، بهدف التقاط الاتجاهات والموسمية والأنماط الدورية في البيانات من خلال بناء النماذج. ولا تستطيع هذه النماذج التنبؤ بالأنماط المتغيرة للبيانات التاريخية فحسب، بل تستطيع أيضًا تحليل اتجاهات التطوير المستقبلية. وتتمتع تطبيقاتها بنطاق واسع للغاية، إذ تغطي العديد من المجالات مثل التمويل والأرصاد الجوية والرعاية الطبية والنقل والتنبؤ بالطاقة.

وفي المجال الطبي، يواصل المؤلف الأول لهذه المقالة، البروفيسور لو فنغ من جامعة هواتشونغ للعلوم والتكنولوجيا، التركيز على تطبيق نماذج التنبؤ بالتسلسل.بالإضافة إلى البحث المذكور أعلاه، تعاونت أيضًا مع فريق من جامعة سيدني لنشر ورقة بحثية بعنوان "إطار عمل مركب متعدد الاهتمام للإنذار المبكر بانخفاض ضغط الدم أثناء الجراحة" في وقائع مؤتمر AAAI السابع والثلاثين حول الذكاء الاصطناعي (AAAI'23).

الورق الأصلي:
https://ojs.aaai.org/index.php/AAAI/article/view/26681

في هذه الورقة، اقترح الباحثون إطارًا تحذيريًا للمتابعة لانخفاض ضغط الدم أثناء الجراحة يعتمد على التعدد الوسائط وآلية الانتباه. تظهر التجارب على مجموعتين كبيرتين من البيانات الواقعية أن هذه الطريقة يمكن أن تحقق دقة تصل إلى 94.1% للتحذير المبكر من أحداث انخفاض ضغط الدم أثناء الجراحة، مع تقليل متطلبات معدل أخذ العينات للإشارة بشكل كبير بمقدار 3000 مرة. وعلاوة على ذلك، في مهمة التنبؤ بضغط الشريان المتوسط لمدة 15 دقيقة، وهي المهمة الأكثر تحديًا، حقق الإطار المتعدد الوسائط خطأً مطلقًا متوسطًا قدره 4.48 ملم زئبق، وهو انخفاض في الخطأ بنسبة 42.91% مقارنة بالحلول الحالية.

وعلى نحو مماثل، قام فريق بحثي من جامعة نانجينغ الطبية بتطوير نموذج سلسلة زمنية.يستخدم للتنبؤ بمعدل الإصابة بالتهاب الكبد. وباستخدام نماذج المتوسط المتحرك الانحداري الموسمي ونماذج التنعيم الأسي الموسمية، قاموا بتحليل عدد حالات أنواع مختلفة من التهاب الكبد.

توصلت الدراسات إلى أن شهر مارس/آذار من كل عام هو فترة الذروة لأنواع مختلفة من التهاب الكبد. على مدى السنوات العشر الماضية، كان معدل الإصابة بالتهاب الكبد الوبائي أ في اتجاه تنازلي بشكل عام؛ لقد تذبذب معدل الإصابة بمرض التهاب الكبد الوبائي ب وارتفع في السنوات الأخيرة؛ استمر معدل الإصابة بمرض التهاب الكبد الوبائي سي في الارتفاع؛ وظل معدل الإصابة بالتهاب الكبد الوبائي (هـ) مستقراً بشكل أساسي. توفر هذه النتائج أساسًا مهمًا لتطوير تدابير أكثر فعالية للوقاية من التهاب الكبد ومكافحته. نُشرت الدراسة، التي تحمل عنوان "تحليل السلاسل الزمنية والتنبؤ بأربعة اتجاهات وبائية لالتهاب الكبد في الصين من عام 2012 إلى عام 2021"، في مجلة جامعة نانجينغ الطبية (العلوم الطبيعية).

باختصار، أظهر تطبيق تكنولوجيا التنبؤ بالسلاسل الزمنية في المجال الطبي إمكانات كبيرة. مع التقدم المستمر في العلوم والتكنولوجيا والوفرة المتزايدة للبيانات، نتطلع إلى رؤية المزيد من نماذج وطرق التنبؤ بالسلاسل الزمنية المبتكرة في المستقبل للمساهمة بقوة أكبر في صحة الإنسان ورفاهته.

مراجع:
https://mp.weixin.qq.com/s/8gYtFqcuctY0BqBYa1e_Hg

وأخيرًا، أوصي بنشاط أكاديمي! انقر على الصورة لمزيد من التفاصيل↓