V-Net: شبكات العصبي الكاملة للتفتيش الطبقي للصور الطبية ثلاثية الأبعاد

تم استخدام الشبكات العصبية المتشابكة (CNNs) مؤخرًا لحل المشكلات في مجالين هما الرؤية الحاسوبية وتحليل الصور الطبية. على الرغم من شعبيتها، فإن معظم الأساليب قادرة فقط على معالجة الصور ثنائية الأبعاد بينما تتألف معظم البيانات الطبية المستخدمة في الممارسة السريرية من أحجام ثلاثية الأبعاد. في هذا العمل، نقترح نهجًا لتقسيم الصور ثلاثية الأبعاد يعتمد على شبكة عصبية متشابكة بالكامل وحجمية. يتم تدريب شبكتنا العصبية المتشابكة (CNN) بشكل كامل ومتكامل على أحجام التصوير بالرنين المغناطيسي (MRI) التي تصور البروستاتا، وتتعلم التنبؤ بعملية التقسيم للحجم بأكمله دفعة واحدة. نقدم دالة هدف جديدة، والتي نقوم بتحسينها أثناء التدريب، تعتمد على معامل دييس (Dice coefficient). بهذه الطريقة يمكننا التعامل مع الحالات التي يوجد فيها اختلال كبير بين عدد البكسلات الأمامية والخلفية. للتعامل مع العدد المحدود للأحجام المشهرة المتاحة للتدريب، نقوم بتوسيع البيانات بتطبيق تحولات غير خطية عشوائية وتطابق التوزيع التاريخي (histogram matching). نظهر في تقييمنا التجريبي أن نهجنا يحقق أداءً جيدًا على بيانات الاختبار الصعبة بينما يحتاج إلى جزء صغير فقط من وقت المعالجة الذي تحتاجه الطرق السابقة.