التحليل التلقائي للصور الطبية العامّة المستقلة عن الوسيلة من خلال الانتباه متعدد الترددات في المقياس المتعدد

تلعب القابلية العامة في الشبكات العصبية العميقة دورًا محوريًا في تقسيم الصور الطبية. ومع ذلك، فإن التحليلات القائمة على التعلم العميق للصور الطبية تميل إلى إهمال أهمية التباين الترددي، وهو عنصر حاسم لتحقيق نموذج يكون مُتجانسًا مع الوسائط (modality-agnostic) وعامًا في المجال (domain-generalizable). علاوة على ذلك، تفشل العديد من النماذج في أخذ الخسارة المحتملة للمعلومات بعين الاعتبار التي قد تنشأ من التعلم متعدد المهام تحت الإشراف العميق، وهي عامل يمكن أن يُضعف قدرة النموذج على التمثيل. لمعالجة هذه التحديات، نقترح شبكة مُتجانسة مع الوسائط وعامة في المجال (MADGNet) لتقسيم الصور الطبية، والتي تتكون من مكونين رئيسيين: كتلة الانتباه متعددة الترددات في مقاييس متعددة (MFMSA) ووحدة فك الترميز المجمعة (E-SDM). تُحسّن كتلة MFMSA عملية استخلاص الميزات المكانية، وخاصة في التقاط ميزات الحدود، من خلال دمج الميزات متعددة الترددات والمقاييس، مما يوفر مؤشرات مفيدة لحدود الأنسجة والهياكل التشريحية. علاوة على ذلك، نقترح E-SDM لتقليل خسارة المعلومات في التعلم متعدد المهام مع الإشراف العميق، خاصة أثناء عملية التكبير الكبيرة من دقة منخفضة. قمنا بتقييم أداء تقسيم MADGNet عبر ستة أنواع من الوسائط وخمسة عشر مجموعة بيانات. ومن خلال تجارب واسعة النطاق، نُظهر أن MADGNet تتفوق باستمرار على النماذج الرائدة في المجال عبر مختلف الوسائط، مُظهرةً أداءً متقدمًا في التقسيم. هذا يؤكد أن MADGNet حلٌّ قوي لتقسيم الصور الطبية، يُبرز كفاءته في سيناريوهات تصوير متنوعة. يُمكن الاطلاع على كود MADGNet على رابط GitHub.