الانغراس الموضعي متعدد النوى لـ ConvNeXt للتمييز بين البوليبات

التفصيل الصور الطبية هو التقنية التي تساعد الأطباء على مشاهدة الصور وتشخيصها بدقة، خاصة في سرطان القولون والمستقيم. وبشكل خاص، مع زيادة حالات الإصابة، أصبح من الضروري أن يكون التشخيص والتحديد أسرع وأكثر دقة للكثير من المرضى؛ في الصور التنظيرية، أصبحت مهمة التفصيل حاسمة لمساعدة الطبيب على تحديد موقع البُطُور أو الألم في الجهاز بشكل صحيح. نتيجة لذلك، تم بذل جهود كثيرة لتطبيق التعلم العميق لautomate (أتمتة) تفصيل البُطُور، وذلك بهدف تحسين الهيكل U-shape (U-شكل). ومع ذلك، فإن مخطط الاتصالات القفزية البسيطة في UNet يؤدي إلى نقص المعلومات السياقية والتفاوت الدلالي بين الخرائط المميزة من المشفِّر والمفكِّك. للتعامل مع هذه المشكلة، نقترح إطارًا جديدًا يتكون من هيكل ConvNeXt الأساسي وكتلة Multi Kernel Positional Embedding (متعددة النواة للدمج الموضعي). بفضل الوحدة المقترحة، يمكن لطرقنا تحقيق دقة وتعميم أفضل في مهمة تفصيل البُطُور. تظهر التجارب الواسعة أن نموذجنا يحقق معامل Dice قدره 0.8818 ونسبة IOU قدرها 0.8163 على مجموعة بيانات Kvasir-SEG. بالإضافة إلى ذلك، حققنا نتائج تنافسية مع طرق الرائدة السابقة على مجموعات بيانات مختلفة.