U-Mamba: تحسين الاعتماد على المسافات الطويلة لتقسيم الصور الطبية

تمثّل الشبكات العصبية التلافيفية (CNNs) والمحولات (Transformers) أكثر المعمارية شيوعًا في تقسيم الصور الطبية الحيوية، لكن كلاهما يعاني من قدرة محدودة على التعامل مع الاعتماديات الطويلة المدى نظرًا لطبيعته المحلية المتأصلة أو التعقيد الحسابي المرتفع. ولحل هذه التحديات، نقدّم U-Mamba، وهي شبكة عامة الغرض مخصصة لتقسيم الصور الطبية الحيوية. مستوحاة من نماذج التسلسلات الحالة (SSMs)، وهي عائلة جديدة من النماذج العميقة للتسلسلات المعروفة بقدرتها القوية على معالجة التسلسلات الطويلة، صممنا كتلة هجينة تجمع بين قدرة الطبقات التلافيفية على استخلاص الميزات المحلية وقدرات نماذج SSM في التقاط الاعتماديات الطويلة المدى. علاوةً على ذلك، يتمتع U-Mamba بآلية تهيئة ذاتية تمكنه من التكيف تلقائيًا مع مختلف مجموعات البيانات دون تدخل يدوي. أجرينا تجارب واسعة على أربع مهام متنوعة، تشمل تقسيم الأعضاء في البطن ثلاثية الأبعاد باستخدام صور الأشعة المقطعية (CT) والتصوير بالرنين المغناطيسي (MR)، وتقسيم الأدوات في صور المنظار، وتقسيم الخلايا في صور المجهر. أظهرت النتائج أن U-Mamba يتفوّق على أفضل الشبكات القائمة على CNN وTransformers في جميع المهام. هذا يفتح آفاقًا جديدة لنمذجة فعّالة للاعتماديات الطويلة المدى في تحليل الصور الطبية الحيوية. تم إتاحة الكود والنماذج والبيانات بشكل عام عبر الرابط: https://wanglab.ai/u-mamba.html.