شبكة التعلم متعدد الأمثلة ذات التدفق المزدوج للتصنيف الصوري للصورة الكاملة باستخدام التعلم التناصي الذاتي

نعالج المشكلة الصعبة لتصنيف صور الشرائح الكاملة (WSI). تتميز صور الشرائح الكاملة بدقة عالية جدًا، وغالبًا ما تفتقر إلى التسميات الموضعية. يمكن صياغة تصنيف صور الشرائح الكاملة كمشكلة تعلم متعددة المجموعات (MIL) عندما تكون التسميات متاحة فقط على مستوى الشريحة. نقترح طريقة قائمة على MIL لتصنيف صور الشرائح الكاملة وكشف الأورام، دون الحاجة إلى تسميات موضعية. تتكون طريقة العمل لدينا من ثلاثة مكونات رئيسية. أولاً، نقدم مُجمّعًا جديدًا لـ MIL يُنمذج العلاقات بين العناصر داخل بنية ثنائية التدفق باستخدام قياس مسافة قابل للتدريب. ثانيًا، نظرًا لأن صور الشرائح الكاملة يمكن أن تُنتج مجموعات كبيرة أو غير متوازنة، مما يعيق تدريب نماذج MIL، نقترح استخدام التعلم التلقائي التبايني (self-supervised contrastive learning) لاستخراج تمثيلات جيدة لـ MIL، وتخفيف مشكلة التكلفة الذاكرة الهائلة الناتجة عن المجموعات الكبيرة. ثالثًا، نستخدم آلية دمج هرمية لتمثيلات صور الشرائح الكاملة متعددة المقياس، ونُحسّن بدقة تصنيف وتحديد المواقع. تم تقييم نموذجنا على مجموعتي بيانات ممثلتين لصور الشرائح الكاملة. تُظهر دقة تصنيف نموذجنا مقارنة جيدة مع الطرق المدربة بالكامل باستخدام التسميات، مع فجوة دقة أقل من 2٪ عبر المجموعات المختلفة. كما تفوق نتائجنا جميع الطرق السابقة القائمة على MIL. وتُظهر نتائج المقارنة الإضافية على مجموعات بيانات MIL القياسية أداءً متميزًا لمُجمّع MIL لدينا في المشكلات العامة لـ MIL. مستودع GitHub: https://github.com/binli123/dsmil-wsi