
في السنوات الأخيرة، أصبحت عملية فصل البوليبات (polyp segmentation) ذات أهمية كبيرة، وتم تطوير العديد من الطرق باستخدام الشبكات العصبية التلافيفية (CNN) والمحولات البصرية (Vision Transformer) وتقنيات المحولات (Transformer) لتحقيق نتائج تنافسية. ومع ذلك، غالبًا ما تواجه هذه الطرق صعوبات عند التعامل مع مجموعات بيانات خارج التوزيع (out-of-distribution datasets)، والحدود المفقودة، والبوليبات الصغيرة. في عام 2022، تم تقديم "ميتا-فورمر" (Meta-Former) كمبدأ أساسي جديد للرؤية الحاسوبية، حيث ساهم ليس فقط في تحسين أداء الرؤية الحاسوبية متعددة المهام، بل وعالج أيضًا قيود المُحفّزات الأساسية (backbones) من فئتي Vision Transformer وCNN. ولتحسين عملية الفصل بشكل أكبر، نقترح دمج Meta-Former مع معمارية UNet، إلى جانب إدخال بلوك تكبير متعدد المقاييس (Multi-scale Upsampling block) يعتمد على تجميع مستويات متعددة في مرحلة الترميز العكسي (decoder stage)، بهدف تعزيز التفاصيل النسيجية. كما نقترح أيضًا بلوك Convformer مبني على مفهوم Meta-Former، لتعزيز المعلومات الحاسمة في الميزات المحلية. تسمح هذه البلوكات بدمج المعلومات الشاملة، مثل الشكل العام للبوليب، مع المعلومات المحلية والمعلومات الحدودية، وهي عوامل حاسمة في اتخاذ قرارات التصنيف الطبي. أظهرت الطريقة المقترحة أداءً تنافسيًا، وحققت أفضل نتيجة في أحدث الأداء (State of the Art) على مجموعات بيانات CVC-300 وKvasir وCVC-ColonDB. وباستثناء Kvasir-SEG، فإن جميع المجموعات الأخرى تُعدّ مجموعات بيانات خارج التوزيع. يمكن الاطلاع على التنفيذ على الرابط التالي: https://github.com/huyquoctrinh/MetaPolyp-CBMS2023.