MSRF-Net: شبكة تكاملية متعددة المقياس مع تحسينات تلافيفية لتقسيم الصور الطبية

أظهرت الطرق المستندة إلى الشبكات العصبية التلافيفية تحسينًا في أداء تقسيم الصور الطبية الحيوية. ومع ذلك، فإن معظم هذه الطرق لا تتمكن من تقسيم الكائنات ذات الأحجام المتغيرة بكفاءة، ولا من التدريب على مجموعات بيانات صغيرة ومشوهة، وهي حالات شائعة في التطبيقات الطبية الحيوية. وعلى الرغم من وجود طرق تدمج منهجيات دمج متعددة المقاييس لمعالجة التحديات الناتجة عن التغير في أحجام الكائنات، إلا أنها تستخدم غالبًا نماذج معقدة تكون مناسبة أكثر لمشاكل التقسيم الدلالي العام. في هذه الورقة، نقترح معمارية جديدة تُسمى شبكة الدمج المتعدد المقياسات ذات التغذية العكسية (MSRF-Net)، المصممة خصيصًا لتقسيم الصور الطبية الحيوية. تتيح MSRF-Net المُقترحة تبادل الميزات متعددة المقاييس ذات المجالات المستقبلة المتنوعة باستخدام كتلة دمج كثيف ثنائي المقياس (DSDF). وتُتيح كتلة DSDF هذه تبادل المعلومات بدقة بين مقياسين مختلفين للدقة، بينما تستخدم الوحدة الفرعية MSRF عدة كتل DSDF متتالية لتنفيذ دمج متعدد المقاييس. هذا يسمح بالحفاظ على الدقة، وتحسين تدفق المعلومات وانتشار الميزات عالية ومنخفضة المستوى للحصول على خرائط تقسيم دقيقة. وتُتيح MSRF-Net المُقترحة التقاط التباينات في الأحجام الكائنية، وتوفر نتائج محسّنة على مجموعة متنوعة من مجموعات الصور الطبية الحيوية. وتبين التجارب الواسعة على MSRF-Net أن الطريقة المقترحة تتفوق على أحدث الطرق في تقسيم الصور الطبية الحيوية على أربع مجموعات بيانات مفتوحة المصدر. وحققنا معامل ديك (Dice coefficient) قدره 0.9217 و0.9420 و0.9224 و0.8824 على مجموعات بيانات Kvasir-SEG وCVC-ClinicDB وبيانات مسابقة علوم البيانات 2018 وتحدي تقسيم آفات الجلد ISIC-2018 على التوالي. كما أجرينا اختبارات على قدرة التعميم، وحققنا معامل ديك قدره 0.7921 و0.7575 على مجموعتي بيانات CVC-ClinicDB وKvasir-SEG على التوالي.