HyperAIHyperAI
منذ 3 أشهر

نموذج FCB-SwinV2 Transformer لتقسيم الأنسجة الوعائية

Kerr Fitzgerald, Bogdan Matuszewski
نموذج FCB-SwinV2 Transformer لتقسيم الأنسجة الوعائية
الملخص

إن تجزئة الأورام داخل إطارات مقاطع الفيديو التي تُجرى أثناء المنظار المعوي باستخدام نماذج التعلم العميق يمتلك القدرة على أتمتة سير العمل لدى الأطباء. ويمكن أن يسهم ذلك في تحسين معدل الكشف المبكر وتصنيف الأورام التي قد تتطور إلى سرطان القولون والمستقيم. وقد جمعت النماذج الحديثة المتطورة في مجال تجزئة الأورام القائمة على التعلم العميق بين مخرجات هياكل الشبكات التلافيفية الكاملة (Fully Convolutional Network) والشبكات المُحَوِّلة (Transformer Network) التي تعمل بالتوازي. في هذه الورقة، نقترح تعديلات على النموذج الحالي المُعدّل للحالة الراهنة في تجزئة الأورام، وهو نموذج FCBFormer. حيث تم استبدال البنية المُحَوِّلة في FCBFormer ببنية SwinV2 Transformer-UNET، كما تم إجراء تحسينات طفيفة على هيكل الشبكة التلافيفية الكاملة لإنشاء النموذج الجديد المسمى FCB-SwinV2 Transformer. وتم تقييم أداء النموذج FCB-SwinV2 Transformer على مجموعتي بيانات شهيرتين لاختبار تجزئة المنظار المعوي، وهما Kvasir-SEG و CVC-ClinicDB، بالإضافة إلى إجراء اختبارات لتحديد قدرة التعميم. وقد أظهر النموذج FCB-SwinV2 Transformer أداءً متفوقًا بشكل مستمر، حيث سجّل قيمًا أعلى في معامل mDice في جميع الاختبارات، مما يجعله يُمثّل أحدث مستوى من الأداء في هذا المجال. كما تم الإبلاغ عن ومناقشة بعض المشكلات التي تُواجه تقييم أداء نماذج تجزئة المنظار المعوي في الأدبيات العلمية. ومن أبرز هذه المشكلات التي تم التعرف عليها هو أن من الأفضل تجنّب حدوث تسرب بيانات (data leakage) من تسلسلات الفيديو أثناء تقسيم البيانات إلى مجموعات التدريب والتحقق والاختبار، خاصة عند تقييم الأداء على مجموعة بيانات CVC-ClinicDB.