لتحليل صور الأمراض على نطاق واسع للغاية! تقترح جامعة هواتشونغ للعلوم والتكنولوجيا نموذجًا لتجزئة الصور الطبية لتحسين دقة تشخيص متلازمة سجوجرن

جفاف الفم، جفاف العينين، جفاف الجلد، مصحوبًا بآلام عضلية غير مبررة وتعب عام كل يوم. إذا كنت تعاني من الأعراض المذكورة أعلاه، فبالإضافة إلى مراعاة الطقس الجاف في الشتاء، يجب عليك أيضًا أن تكون منتبهًا لمرض شائع ولكن غالبًا ما يتم تجاهله - متلازمة سجوجرن (SS).
متلازمة شوغرن هي مرض مناعي ذاتي يتميز بتسلل الخلايا الليمفاوية بشكل كبير إلى الغدد الصماء.يعاني حوالي 5 ملايين شخص في بلدنا من هذا المرض. في المراحل المبكرة من المرض، يتم تدمير الغدد الصماء (الغدد اللعابية، الغدد الدمعية، الخ) بواسطة الخلايا الليمفاوية المتسللة بشدة، مما يؤدي إلى ضعف وظيفتها. غالبًا ما يعاني المرضى من جفاف الفم وجفاف العينين، وقد تظهر عليهم أيضًا أعراض مثل الألم في مفصلي الكتف. وفي الوقت نفسه، فإن المرض يؤثر أيضًا على أعضاء مهمة أخرى، مثل الرئتين والكبد والكلى، وحتى يؤثر على الخصوبة.

يعد الكشف المبكر وتشخيص متلازمة سجوجرن أمرًا بالغ الأهمية، كما يعد التهاب الغدد اللعابية الليمفاوية البؤري (FLS) أحد المعايير المهمة لتشخيص متلازمة سجوجرن. من خلال الحصول على مقاطع مرضية من الغدد اللعابية الصغيرة للمريض وإجراء الفحص المجهري وفقًا للمعايير التشخيصية الموجودة،إذا تم العثور على أكثر من 50 تجمعًا من الخلايا الليمفاوية لكل 4 مم2 من عينة الأنسجة، فقد تم اعتبار ذلك آفة نموذجية.
ومع ذلك، يمكن لصورة المسح المرضي الكامل أن تصل إلى 100000*100000 بكسل، أي ما يعادل حوالي مليار بكسل. يحتاج الأطباء إلى فحص الصورة بأكملها بعناية وتحديد عدد بؤر تجمع الخلايا الليمفاوية. وهذا لا يستغرق وقتا طويلا فحسب، بل يعتمد أيضا في كثير من الأحيان على الخبرة والحكم الذاتي للأطباء المحترفين، مما يزيد من خطر التشخيص الخاطئ أو عدم التشخيص.
ولمعالجة التحديات المذكورة أعلاه،اقترح البروفيسور تو وي والبروفيسور لو فنغ من جامعة هواتشونغ للعلوم والتكنولوجيا نموذج تقسيم الصور الطبية M2CF-Net باستخدام تقنية الرؤية الحاسوبية المعروفة في مجالات القيادة الذاتية والتعرف على الوجه.من خلال دمج تقنيات التعرف على الصور متعددة الدقة ومتعددة المقاييس، لا يستطيع نموذج M2CF-Net "رؤية" الاختلافات الدقيقة في الصور المرضية فحسب، بل يمكنه أيضًا تحديد وحساب المؤشرات الحيوية الرئيسية بدقة - بؤر تجمع الخلايا الليمفاوية، مما يساعد الأطباء على إجراء تشخيصات أسرع وأكثر دقة.
تم نشر نتائج البحث في مؤتمر IEEE الدولي للذكاء الاصطناعي الطبي لعام 2023 (MedAI) تحت عنوان "M2CF-Net: شبكة اندماج متقاطعة متعددة الدقة ومتعددة المقاييس لتقسيم آفة الأمراض في التهاب الغدد اللعابية الليمفاوي البؤري".
أبرز الأبحاث:
* حل مشكلة صعوبة تحديد مجموعات الخلايا الليمفاوية الصغيرة في صور أمراض الأنسجة واسعة النطاق للغاية
* من خلال دمج الدقة المتعددة والمقاييس المتعددة، يتفوق M2CF-Net على نماذج التجزئة الدلالية للصور الطبية الثلاثة السائدة الأخرى
* يؤدي M2CF-Net أداءً جيدًا في معالجة الصور ذات الحدود غير الواضحة والأشياء الصغيرة والملمس المعقد. تتميز صورها المجزأة بأشكال أكثر تعقيدًا وتتوافق تمامًا مع الحقائق الأساسية التي شرحها الإنسان

عنوان الورقة:
https://doi.ieeecomputersociety.org/10.1109/MedAI59581.2023.00063
يجمع المشروع المفتوح المصدر "awesome-ai4s" أكثر من مائة تفسير ورقي لـ AI4S ويوفر مجموعات وأدوات ضخمة من البيانات:
https://github.com/hyperai/awesome-ai4s
مجموعة البيانات: البيانات السريرية من مستشفى تونغجي
تستخدم هذه الدراسة مجموعة من مجموعات البيانات الخاصة بمقاطع أمراض الغدد اللعابية الصغيرة من مستشفى تونغجي.ومن بينها، تمت إزالة الغدد اللعابية الصغيرة من المرضى الذين يعانون من متلازمة شوغرن الأولية.
*تتوزع الغدد اللعابية الصغيرة تحت الغشاء المخاطي لتجويف الفم والبلعوم عند الإنسان. وظيفتها هي إفراز اللعاب، والحفاظ على رطوبة تجويف الفم، ومساعدة الهضم، وحماية أنسجة الفم من العدوى.
من خلال صبغ أجزاء مرضية من الغدد اللعابية الصغيرة، يستطيع الأطباء ملاحظة البنية الواضحة للخلايا تحت المجهر. وعلى وجه التحديد، قام الباحثون بمراجعة جميع الشرائح لضمان الجودة والتأكد من وجود التهاب البلعوم الليمفاوي البؤري، والذي يتميز بتجمعات تضم أكثر من 50 خلية ليمفاوية لكل 4 ملليمتر مربع حول الغدة. إذا كان هناك آفة، يتم وضع علامة عليها.
تتكون مجموعة البيانات النهائية من 203 عينة، بما في ذلك 171 عينة إيجابية (التي تلبي خصائص الآفة) و 32 عينة سلبية (التي لا تلبي خصائص الآفة).قام الباحثون بتقسيم هذه العينات إلى مجموعات تدريبية ومجموعات تحقق ومجموعات اختبار بنسبة معينة، والتي تم استخدامها لتدريب النموذج والتعديل وتقييم الأداء على التوالي. وفي العملية الفعلية، قام الباحثون بمعالجة البيانات مسبقًا، الأمر الذي لم يقلل من كمية الحسابات فحسب، بل أدى أيضًا إلى تحسين قدرة النموذج على التعميم.
تصميم خط أنابيب معالجة الصور على نطاق واسع لتحسين الخطوة الأولى من تدريب النموذج
هدف هذه الدراسة هو استخراج منطقة الآفة من التهاب الغدد اللعابية الليمفاوي البؤري (FLS) من مقاطع أنسجة الغدد اللعابية الصغيرة بدقة 100000 * 100000. ومع ذلك، فمن المستحيل إدخال صور جيجابكسل مباشرة في الشبكات العصبية للتدريب، ويرجع ذلك أساسًا إلى أن هذه الصور كبيرة جدًا وموارد الحوسبة ووقت التدريب والأطر الموجودة وما إلى ذلك غير كافية لدعمها.
ولذلك، صمم الباحثون خط أنابيب لمعالجة صور الأمراض على نطاق واسع للغاية.يتضمن خط الأنابيب بشكل أساسي ثلاث خطوات: استخراج مناطق الاهتمام (ROI)، وتطبيع البقعة، وتصحيح الصورة (WSl Patching). كما هو موضح في الشكل التالي:

الجزء 1: استخراج منطقة الاستثمار
لتحسين دقة تحديد مناطق الأنسجة المحددة في الصور المرضية، استخدم الباحثون في البداية مصنفًا يعتمد على الشبكة العصبية التلافيفية (CNN). ومع ذلك، واجه المصنف صعوبات في التعامل مع السمات المعقدة مثل الفقاعات والأنسجة المجزأة والتحف، مما أدى إلى عدم تلبية أدائه للتوقعات. ولمعالجة هذه المشكلة اتخذ فريق البحث الإجراءات التالية:
* التعليق اليدوي: تم التعليق على جزء من العينات بالتفصيل، وتم إعادة تدريب نموذج التصنيف بعد إثراء مجموعة البيانات.
* زيادة البيانات: استخدم تقنيات مثل التدوير والتوسع والترجمة لزيادة تنوع بيانات التدريب، وبالتالي تحسين دقة المصنف.
الجزء الثاني: توحيد معايير التلوين
الهدف الرئيسي من توحيد معايير تلوين صور علم الأمراض هو التأكد من أن الصور من مصادر مختلفة لها لون بصري وتباين ثابت. على وجه التحديد، بسبب تأثير عوامل مثل تركيز الصبغة وقيمة الرقم الهيدروجيني ودرجة الحرارة والوقت، تحدث مشاكل مثل التلوين غير المتساوي أو الشدة غير المتسقة في كثير من الأحيان في عملية التلوين الفعلية، مما يؤدي إلى تأثيرات بصرية مختلفة لنفس نوع الأنسجة. يمكن أن يؤثر هذا الاختلاف على دقة نماذج الرؤية الحاسوبية.
ولحل هذه المشكلة، استخدم الباحثون خوارزمية Vahadane. تعمل الخوارزمية على تحقيق تأثير توحيد الألوان عن طريق ضبط خصائص اللون للصورة المصدر لجعلها مشابهة للصورة المستهدفة. على وجه التحديد، يقوم بحساب تحويل مصفوفة الألوان بين الصورة المصدر والصورة المستهدفة لتحقيق تحويل اللون للصورة المصدر.
الجزء الثالث: تقسيم الصورة
يهدف هذا إلى معالجة المشكلة المتمثلة في أن حجم الصورة لا يزال كبيرًا جدًا بعد استخراج منطقة الاهتمام وتطبيع التلوين، مما يؤدي إلى عدم القدرة على إدخال العينة في نموذج التعلم العميق للتدريب. اعتمد الباحثون على أسلوب تدريب يعتمد على الرقعة لتقسيم الصورة إلى كتل صغيرة ذات مناطق متداخلة، وهو ما لم يحسن كفاءة تدريب النموذج فحسب، بل احتفظ أيضًا بالمعلومات الأصلية.
من أجل تحليل السمات التفصيلية للخلايا الليمفاوية الصغيرة بالقرب من القنوات الأكبر، من الضروري التقاط السمات على مستوى الأنسجة عبر مجال رؤية أكبر. ومع ذلك، من أجل ضمان دقة نتائج التجزئة، من الضروري التقاط ميزات على مستوى الخلية في مجال رؤية أصغر. ومن المهم بشكل خاص أن نتمكن من إيجاد التوازن بين الاثنين.
ولتحقيق هذه الغاية، نظر الباحثون في طريقة تقسيم الصور متعددة الدقة، والتي تتضمن بشكل أساسي تقليص حجم الصورة الأصلية عدة مرات واستخراج كتل صور بنفس الحجم من هذه الصور التي تم تقليص حجمها. تتمتع هذه البقع المقطوعة من الصور بتكبيرات عينات مختلفة بأحجام مختلفة من مجال الرؤية، مما يمكنها التقاط ميزات على مستوى الأنسجة وميزات على مستوى الخلية.
نموذج اندماج متعدد الدقة ومتعدد المقاييس، وتحسين الأداء بكفاءة
يتضمن نموذج M2CF-Net الذي اختاره الباحثون مشفرًا متعدد الفروع وفك تشفير متسلسل يعتمد على الاندماج.يقوم المشفر بتخفيض عينات ميزات البقع ذات الدقة المختلفة بمقاييس مختلفة، بينما يستخدم فك التشفير كتلة اندماج متتالية لدمج خرائط الميزات التي تم إنشاؤها بواسطة مشفرات متعددة الفروع.

وعلى وجه التحديد، من أجل الحصول على ميزات في وقت واحد على مستوى الأنسجة والمستوى الخلوي، صمم الباحثون شبكة متعددة الفروع، وهو نموذج معماري نموذجي للمشفر-الفك يمكنه قبول صور بدقة مختلفة كمدخلات. يتضمن المشفر ثلاثة فروع إدخال تقبل صورًا بدقة مختلفة الأحجام وتولد مجموعات خرائط الميزات لحقول رؤية مختلفة أثناء عملية التشفير. يمكن لفك التشفير الجمع بين خرائط الميزات التي تم إنشاؤها بواسطة المشفر باستخدام كتلة الاندماج المتتالية لإخراج خريطة التنبؤ النهائية.
وفي هذه العملية، استخدم الباحثون أيضًا آليات الانتباه المكاني وانتباه القناة لتعزيز قدرات التمثيل لميزات الإدخال. أخيرًا، يتم استخدام BCEDice Loss كدالة خسارة للنموذج. تقوم دالة الخسارة هذه بوزن خسارة إنتروبيا التقاطع الثنائي وخسارة النرد، مما يمكن أن يوجه بشكل فعال اتجاه تحسين النموذج.
الاستنتاج التجريبي: يتفوق M2CF-Net على نماذج التجزئة الدلالية للصور الطبية الثلاثة السائدة الأخرى
قام الباحثون بمقارنة نموذجهم المقترح (M2CF-Net) مع أربعة نماذج أخرى شائعة لتجزئة دلالات الصور الطبية - UNet، وMSNet، وHookNet، وTransUNet. وأظهرت النتائج أن نموذج M2CF-Net يتمتع بمزايا أكثر في استخدام ميزات الدقة المتعددة والمقاييس المتعددة.
* UNet: يستخدم بنية التشفير وفك التشفير لالتقاط ميزات متعددة المقاييس من أجل التجزئة الدقيقة
* MSNet: يقدم شبكة طرح متعددة المقاييس لتحسين استخراج الميزات وتحسين دقة التجزئة
* HookNet: تمت إضافة Hook لالتقاط واستخدام ميزات الدقة المتعددة، وتعزيز بنية U-Net، والتعامل بفعالية مع تقسيم الصور ذات الأحجام المختلفة في الصور الطبية
* TransUNet: يعتمد على Transformer، فهو يعمل على تحسين دقة التجزئة من خلال تقديم آلية الاهتمام الذاتي
وكما هو موضح في الشكل أدناه، وجد الباحثون أن M2CF-Net حقق أعلى قيمة Dice وهي 69.40%، وكان عدد معلماته نصف عدد معلمات TransUNet فقط، التي احتلت المرتبة الثالثة. وقد تفوقت على UNet وMSNet، والتي كانت تحتوي على عدد أقل من المعلمات، بمقدار 38.9% و22.5% على التوالي.يمكنه التقاط ودمج ميزات المقاييس المختلفة في الصور بشكل فعال.

على وجه التحديد، عدد المعلمات (Params) في M2CF-Net أقل من تلك الموجودة في TransUNet و HookNet، ولكن أكثر من تلك الموجودة في UNet و MSNet. يرجع ذلك إلى أن TransUNet يعتمد على بنية Transformer، التي تحتوي على معلمات أكثر مقارنةً بـ CNN، كما أن فك التشفير أحادي الفرع يجعل عدد معلمات M2CF-Net أقل من HookNet. ومع ذلك، فإن بنية المشفر متعدد الفروع في M2CF-Net تؤدي إلى عدد أكبر من المعلمات مقارنة بشبكة الإدخال ذات الفرع الواحد.
وبالإضافة إلى ذلك، بعد التحليل المتعمق،توصلت الدراسة إلى أن M2CF-Net يعمل بشكل جيد في معالجة الصور ذات الحدود غير الواضحة والأشياء الصغيرة والملمس المعقد. كما هو موضح في الشكل أدناه، فإن نتائج تقسيم M2CF-Net لها أشكال أكثر تعقيدًا، وهو ما يتوافق مع الحقيقة الأساسية التي شرحها الإنسان.

تُحدث تقنية الرؤية الحاسوبية ثورة في تقسيم الصور الطبية
يعد تحليل الصور الطبية أمرا بالغ الأهمية لتشخيص الأمراض. يمكن استخدام تكنولوجيا الكمبيوتر لتقسيم الصور الطبية بدقة وتحديد مناطق الآفات والأعضاء البشرية ومواقع العدوى بشكل فعال، وبالتالي تحسين كفاءة التشخيص. في السنوات الأخيرة، وبفضل تقدم التقنيات المتقدمة مثل التعلم العميق، تحولت تقنية تقسيم الصور الطبية بسرعة من التشغيل اليدوي إلى المعالجة الآلية، وأصبحت أنظمة الذكاء الاصطناعي المدربة بشكل خاص الآن أداة مساعدة لا غنى عنها للمهنيين الطبيين.
البروفيسور تو وي، نائب مدير قسم أمراض الروماتيزم والمناعة، مستشفى تونغجي، كلية تونغجي الطبية، جامعة هواتشونغ للعلوم والتكنولوجيا،يمتلك أكثر من 20 عامًا من الخبرة في تشخيص وعلاج الأمراض الروماتيزمية والمناعية ولديه خبرة واسعة في التشخيص في متلازمة سجوجرن. في هذه الدراسة، قام البروفيسور تو وي بتحليل عميق لعملية التشخيص المرضي لمتلازمة شوغرن، وأشار إلى النقاط الرئيسية التي من السهل الخلط بينها، وأظهر نتائج التشخيص في مواقف مختلفة من خلال حالات فعلية. بعد إتقان طريقة التشخيص المرضي لمتلازمة شوغرن،واقترح فريق البروفيسور لو فينج استخدام تقنية تقسيم الصور في الرؤية الحاسوبية لمعالجة التحديات التشخيصية.وقد استخدم الطرفان تكنولوجيا الذكاء الاصطناعي المتقدمة لفتح طريق جديد لتشخيص متلازمة سجوجرن.
الصفحة الشخصية للأستاذ تو وي:
https://www.tjh.com.cn/MedicalService/outpatient_doctor.html?codenum=101110
الصفحة الشخصية للأستاذ لو فنغ:
http://faculty.hust.edu.cn/lufeng2/zh_CN/index.htm
بالإضافة إلى الباحثين المذكورين أعلاه، هناك العديد من العلماء المكرسين للأبحاث المتطورة في تقاطع التصوير الطبي والذكاء الاصطناعي.
على سبيل المثال، اقترح فريق من مختبر علوم الكمبيوتر والذكاء الاصطناعي التابع لمعهد ماساتشوستس للتكنولوجيا (MIT CSAIL)، بالتعاون مع باحثين من مستشفى ماساتشوستس العام وكلية الطب بجامعة هارفارد، نموذجًا عامًا، ScribblePrompt، لتجزئة الصور الطبية الحيوية التفاعلية.لا تدعم أداة التجزئة القائمة على الشبكة العصبية هذه المعلقين الذين يستخدمون طرق الشرح المختلفة مثل الخربشات والنقر والمربعات المحددة لأداء مهام تجزئة الصور الطبية الحيوية المرنة فحسب، بل تعمل أيضًا بشكل جيد مع العلامات وأنواع الصور غير المدربة.
وأعتقد أنه مع تطوير المزيد من التقنيات المتقدمة وتطبيقها في الممارسة السريرية، فإن فروعًا طبية متعددة مثل علم الأورام وعلم الأعصاب سوف تستفيد، وسوف يفتح مجال تحليل الصور الطبية آفاقًا أكثر إشراقًا للتطور.