{Radu Marculescu Md Mostafijur Rahman}

الملخص
أظهرت نماذج التحويل (Transformers) إمكانات كبيرة في تقسيم الصور الطبية بفضل قدرتها على التقاط الاعتماديات طويلة المدى من خلال الانتباه الذاتي. ومع ذلك، فإنها تفتقر إلى القدرة على تعلّم العلاقات المحلية (السياقية) بين البكسلات. حاولت الدراسات السابقة التغلب على هذه المشكلة من خلال دمج طبقات التصفية التلافيفية (convolutional layers) إما في وحدات المُشفِّر (encoder) أو المُفكِّك (decoder) لنموذج التحويل، مما أدى في بعض الأحيان إلى ظهور ميزات غير متسقة. ولحل هذه المشكلة، نقترح مُفكِّكًا جديدًا يعتمد على الانتباه يُسمى CASCaded Attention DEcoder (CASCADE)، الذي يستفيد من الخصائص متعددة المقياس للنماذج البصرية الهرمية (hierarchical vision transformers). يتكوّن CASCADE من: (أ) بوابة انتباه تقوم بدمج الميزات باستخدام اتصالات التخطّي (skip connections)، و(ب) وحدة انتباه تلافيفية تعزز السياق الطويل والموقع المحلي من خلال تقليل المعلومات الخلفية. استخدمنا إطارًا متعدد المراحل لجمع الميزات والخسارة، نظرًا لسرعته في التقارب وأداؤه الأفضل. تُظهر تجاربنا أن النماذج القائمة على التحويل مع CASCADE تتفوّق بشكل كبير على أحدث الطرق القائمة على الشبكات العصبية التلافيفية (CNN) والتحويلات، حيث حققت تحسينات تصل إلى 5.07% و6.16% في معايير DICE وmIoU على التوالي. يُمكّن CASCADE من ابتكار طرق جديدة لتصميم مُفكِّكات قائمة على الانتباه بشكل أكثر فعالية.
المعايير القياسية
| معيار قياسي | المنهجية | المقاييس |
|---|---|---|
| medical-image-segmentation-on-automatic | TransCASCADE | Avg DSC: 91.63 |
| medical-image-segmentation-on-automatic | PVT-CASCADE | Avg DSC: 91.46 |
| medical-image-segmentation-on-cvc-clinicdb | PVT-CASCADE | mIoU: 0.8998 mean Dice: 0.9434 |
| medical-image-segmentation-on-cvc-colondb | PVT-CASCADE | mIoU: 0.7453 mean Dice: 0.8254 |
| medical-image-segmentation-on-etis | PVT-CASCADE | mIoU: 0.7258 mean Dice: 0.8007 |
| medical-image-segmentation-on-kvasir-seg | PVT-CASCADE | mIoU: 0.8776 mean Dice: 0.9258 |
| medical-image-segmentation-on-miccai-2015-1 | TransCASCADE | Avg DSC: 82.68 Avg HD: 17.34 |
| medical-image-segmentation-on-miccai-2015-1 | PVT-CASCADE | Avg DSC: 81.06 Avg HD: 20.23 |
| polyp-segmentation-on-kvasir-seg | PVT-CASCADE | mDice: 0.9258 mIoU: 0.8776 |
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.