SegAN: شبكة متنافسة مع خسارة متعددة المقاييس $L_1$ لتقسيم الصور الطبية

مستوحى من الشبكات العصبية المولدة المعادية التقليدية (GAN)، نقترح شبكة عصبية معادية جديدة من النهاية إلى النهاية، تُسمى SegAN، لمهمة تقسيم الصور الطبية. نظرًا لأن تقسيم الصور يتطلب تصنيفًا كثيفًا على مستوى البكسل، قد يكون الإخراج الفردي الحقيقي/المزيف للتمييز في GAN التقليدية غير فعال في إنتاج ردود فعل تدرجية مستقرة وكافية للشبكات. بدلاً من ذلك، نستخدم شبكة عصبية تكرارية بالكامل كمحسّن لإنتاج خرائط التصنيف، ونقترح شبكة تمييز معادية جديدة ذات دالة خسارة $L_1$ متعددة المقاييس لدفع التمييز والمحسن إلى تعلم الخصائص العالمية والمحلية التي تلتقط العلاقات المكانية طويلة ومتوسطة المدى بين البكسلات.في إطار SegAN الخاص بنا، يتم تدريب شبكات المحسن والتمييز بطريقة متبادلة في لعبة الحد الأدنى-الحد الأقصى: يأخذ التمييز كمدخل زوجًا من الصور (الصورة الأصلية * خريطة التصنيف المتوقعة، الصورة الأصلية * خريطة التصنيف الحقيقية)، ثم يتم تدريبه عن طريق تعظيم دالة الخسارة متعددة المقاييس؛ يتم تدريب المحسن باستخدام التدرجات فقط التي يمرها التمييز، بهدف تصغير دالة الخسارة متعددة المقاييس. نوضح أن هذا الإطار SegAN أكثر فعالية واستقرارًا للمهمة التقسيمية، وأنه يؤدي إلى أداء أفضل من طريقة تقسيم U-net الرائدة. قمنا باختبار طريقة SegAN الخاصة بنا باستخدام مجموعات بيانات من تحدي تقسيم الورم الدماغي MICCAI BRATS. تظهر النتائج التجريبية الواسعة فعالية SegAN المقترح مع الخسارة متعددة المقاييس: في BRATS 2013، يعطي SegAN أداءً مكافئًا لأفضل الأساليب الحالية لتقسيم الورم الكامل وتقسيم نواة الورم بينما يحقق دقة وحساسية أفضل لتقسيم نواة الورم المعززة بالغادولينيوم (Gd-enhanced)؛ في BRATS 2015، يحقق SegAN أداءً أفضل من أفضل الأساليب الحالية سواء في درجة القاطع (dice score) أو الدقة.