DGMIL: التعلم المتعدد المثيلات الموجه بالتوزيع لتصنيف صور الشرائح الكاملة

يُستخدم التعلم متعدد الأمثلة (MIL) على نطاق واسع في تحليل صور الشريحة الكاملة الهستوباثولوجية (WSIs). ومع ذلك، لا تُعدّ الطرق الحالية لـMIL مُصمّمة لتمثيل توزيع البيانات بشكل صريح، بل تقتصر على تعلُّم حدٍ فاصل مُميّز على مستوى الحقيبة أو على مستوى المثال من خلال تدريب فاصل تصنيف. في هذه الورقة، نقترح DGMIL: إطار عمل عميقة موجه بتوزيع الميزات لـMIL لتصنيف صور WSIs وتحديد مواقع الشريحة الإيجابية. بدلًا من تصميم هياكل شبكة مميزة معقدة، نُظهر أن التوزيع المميز للسمات في بيانات الصور الهستوباثولوجية يمكن أن يُعدّ دليلاً فعّالاً جدًا لتصنيف المثال. ونُقدّم طريقة لتمثيل توزيع الميزات مشروطة بالتكافؤ (Cluster-conditioned)، واستراتيجية تحسين تدريجي لفضاء الميزات تعتمد على تسمية وهمية (Pseudo label-based)، بحيث يمكن في الفضاء النهائي للسمات فصل المثال الإيجابي عن السلبي بسهولة. تُظهر التجارب على مجموعة بيانات CAMELYON16 وبيانات سرطان الرئة من TCGA أن طريقة لدينا تحقق أفضل نتائج حالية (SOTA) في كل من مهام التصنيف العالمي وتحديد مواقع الشريحة الإيجابية.