Command Palette
Search for a command to run...
DoubleU-Net: شبكة عصبية عميقة قاعدية على الشبكة الدقيقة للتفتيش الطبي
DoubleU-Net: شبكة عصبية عميقة قاعدية على الشبكة الدقيقة للتفتيش الطبي
Debesh Jha Michael A. Riegler Dag Johansen Pål Halvorsen Håvard D. Johansen
الملخص
التمييز الدلالي للصورة هو عملية تسمية كل بكسل في الصورة بصنفه المقابل. يعتبر نهج المُشفِّر والمُفكِّك (encoder-decoder)، مثل U-Net ومتغيراتها، استراتيجية شائعة لحل مهام التمييز الطبي للصور. لتحسين أداء U-Net في مهام التمييز المختلفة، نقترح هندسة جديدة تُدعى DoubleU-Net، وهي مزيج من هندستين U-Net متراكمتين فوق بعضهما البعض. يستخدم أول U-Net مُشفِّر VGG-19 مسبق التدريب، والذي قد تعلم الخصائص من ImageNet ويمكن نقلها بسهولة إلى مهمة أخرى. لالتقاط المزيد من المعلومات الدلالية بكفاءة، أضفنا U-Net آخر في الأسفل. كما نعتمد تقنية Atrous Spatial Pyramid Pooling (ASPP) للا nabershaq السياق داخل الشبكة.لقد قمنا بتقييم DoubleU-Net باستخدام أربع مجموعات بيانات للتمييز الطبي، تغطي أنماط تصوير مختلفة مثل التنظير المعدي المعوي والتنبيب الجلدي والمجهرية. أظهرت التجارب على تحدي التمييز MICCAI 2015 ومجموعة بيانات CVC-ClinicDB وتحدي Data Science Bowl 2018 ومجموعات بيانات تمييز حدود الأورام أن DoubleU-Net يتفوق على U-Net والنماذج الأساسية. علاوة على ذلك، ينتج DoubleU-Net أقنعة تمييز أكثر دقة، خاصة في حالة مجموعة بيانات CVC-ClinicDB وتحدي التمييز MICCAI 2015، والتي تحتوي على صور صعبة مثل البوليبات الصغيرة والمسطحة. هذه النتائج تظهر التحسين على النموذج الحالي من U-Net. النتائج المشجعة التي تم إنتاجها على مجموعات البيانات المختلفة للتمييز الطبي للصور تدل على أن DoubleU-Net يمكن استخدامه كنموذج أساسي قوي لكل من التمييز الطبي للصور وتقييم الاختبار عبر المجموعات لقياس قابلية تعميم نماذج التعلم العميق (Deep Learning - DL).