DCSAU-Net: شبكة U-Net ذات انتباه مجزأ أعمق وأكثر كفاءة للتحليل الطبي للصور

تحقيق التعلم العميق المعمّق باستخدام الشبكة العصبية التلافيفية (CNN) نجاحًا باهرًا في مجال الرؤية الحاسوبية. حيث تمثل U-Net، وهي بنية معمارية مبنية على مبدأ التشفير والفك التشفير باستخدام CNN، تقدمًا كبيرًا في مجال تقسيم الصور البيولوجية الطبية، وقد تم تطبيقها على نطاق واسع في سيناريوهات عملية متعددة. ومع ذلك، فإن التصميم المتساوي لجميع طبقات التقليل في الجزء المشفر، بالإضافة إلى التراكيب المكدسة ببساطة للعمليات التلافيفية، لا يسمح لـ U-Net باستخراج معلومات كافية حول الميزات من عمق مختلف. ويتزايد تعقيد الصور الطبية، مما يفرض تحديات جديدة على الطرق الحالية. في هذا البحث، نقترح شبكة ذات شكل U أعمق وأكثر كفاءة وانقسامًا في الانتباه (DCSAU-Net)، التي تستفيد بفعالية من المعلومات الدلالية المنخفضة المستوى والمستوى العالي من خلال إطارين جديدين: الحفاظ على الميزات الأولية، ووحدة الانتباه المدمجة المقسمة. وقد تم تقييم النموذج المقترح على مجموعات بيانات CVC-ClinicDB و2018 Data Science Bowl وISIC-2018 وSegPC-2021. وأظهرت النتائج أن DCSAU-Net تتفوق على الطرق الرائدة (SOTA) الأخرى من حيث متوسط تقاطع الوحدة (mIoU) ودرجة F1. وبشكل أكثر أهمية، تُظهر النموذج المقترح أداءً ممتازًا في تقسيم الصور الصعبة. يمكن العثور على الشفرة الخاصة بعملنا والتفاصيل التقنية الإضافية على الرابط التالي: https://github.com/xq141839/DCSAU-Net.