HyperAIHyperAI
منذ 17 أيام

TransUNet: النماذج الكبيرة للغة تُحدث مشغلات قوية لتقسيم الصور الطبية

Jieneng Chen, Yongyi Lu, Qihang Yu, Xiangde Luo, Ehsan Adeli, Yan Wang, Le Lu, Alan L. Yuille, Yuyin Zhou
TransUNet: النماذج الكبيرة للغة تُحدث مشغلات قوية لتقسيم الصور الطبية
الملخص

يُعد تجزئة الصور الطبية شرطًا أساسيًا لتطوير أنظمة الرعاية الصحية، خاصة في مجال تشخيص الأمراض ووضع خطط العلاج. في مختلف مهام تجزئة الصور الطبية، أصبحت البنية ذات الشكل "U"، المعروفة أيضًا باسم U-Net، المعيار الفعلي، وقد حققت نجاحًا كبيرًا. ومع ذلك، نظرًا للخصائص المحلية المتأصلة في عمليات الترسيم (convolution)، تُظهر U-Net عادةً قيودًا في نمذجة الاعتماد على المسافات الطويلة بشكل صريح. أما نماذج الـ Transformers، المصممة لمهام التنبؤ من تسلسل إلى تسلسل، فقد ظهرت كمُ architectures بديلة تمتلك آلية انتباه ذاتي عالمية بطبيعتها، لكنها قد تُعاني من قدرة محدودة على التحديد المكاني بسبب نقص التفاصيل من المستوى المنخفض. في هذا البحث، نقترح نموذج TransUNet، الذي يجمع بين مزايا الـ Transformers وU-Net، ليكون بديلًا قويًا لمهام تجزئة الصور الطبية. من جهة، يُستخدم الـ Transformer لترميز قطع الصور المُقسَّمة من خريطة ميزات مُولَّدة بواسطة شبكة عصبية ترسيمية (CNN) كمُتسلسل دخول لاستخراج السياقات العالمية. ومن الجهة الأخرى، يقوم المُفكِّك (decoder) بتوسيع الميزات المشفرة، ثم يُدمج مع خرائط الميزات عالية الدقة من CNN، مما يُمكّن من تحديد دقيق للموقع المكاني. نحن نرى أن الـ Transformers يمكن أن تُستخدم كمُشفِّرات قوية لمهمات تجزئة الصور الطبية، وعند دمجها مع U-Net، يمكنها تعزيز التفاصيل الدقيقة من خلال استعادة المعلومات المكانية المحددة. وقد حقق TransUNet أداءً متفوقًا مقارنة بطرق أخرى متعددة في تطبيقات طبية مختلفة، بما في ذلك تجزئة الأعضاء المتعددة وتمييز القلب. يمكن الوصول إلى الشفرة والنماذج من خلال الرابط: https://github.com/Beckschen/TransUNet.