الاندماج الخطوي للميزات: الدليل المحلي يوجه العالمي

تُعدّ المنظار القولوني حاليًا أكثر تقنيات اكتشاف الأورام الدقيقة في القولون كفاءةً واعترافًا، وهو أمر ضروري للفحص المبكر ومنع سرطان القولون والمستقيم. ومع ذلك، يظل التحديد الدقيق للأورام الدقيقة تحديًا كبيرًا نظرًا لتباين أحجامها وخصائصها الشكلية المعقدة، بالإضافة إلى الحدود غير الواضحة بين الأورام والغشاء المخاطي. وقد أصبح التعلم العميق شائعًا في مهام التحديد الدقيق للأورام، حيث أظهر نتائج ممتازة. لكن بسبب تركيب صور الأورام والأشكال المتغيرة لها، يصبح من السهل على النماذج الحالية للتعلم العميق التعلّم الزائد (Overfitting) على مجموعة البيانات الحالية، ما قد يؤدي إلى فشل نموذج في معالجة بيانات منظار قولوني غير مُشاهدَة من قبل. ولحل هذه المشكلة، نقترح نموذجًا متطورًا حديثًا لتقسيم الصور الطبية، يُسمى SSFormer، والذي يستخدم مشغلًا هرميًا على أساس Transformer لتحسين قدرة النموذج على التعميم. وبشكل خاص، يُمكن لـ "مُفكّك الترابط التدريجي" (Progressive Locality Decoder) الذي نقترحه أن يُعدّل بسهولة مع الهيكل الأساسي الهرمي Transformer، بهدف تأكيد السمات المحلية وتقليل انتشار الانتباه. وقد حقق نموذج SSFormer أداءً متميزًا على مستوى الحالة الحالية في كل من تقييم التعلّم والتعميم.