التكديس العادل العميق من خلال تكبير وتصغير المعلومات التبادلية: نظرية، خوارزمية، ومقاييس

تهدف التجميع العادل إلى تقسيم البيانات إلى مجموعات متميزة مع منع السمات الحساسة (مثل: الجنس، العرق، تقنية تسلسل RNA) من التأثير المهيمن على عملية التجميع. وعلى الرغم من أن عددًا كبيرًا من الدراسات قد تم إنجازها مؤخرًا وحققت نجاحًا كبيرًا، إلا أن معظم هذه الدراسات تعتمد على منهجيات تجريبية، وتعاني من غياب نظرية موحدة لتصميم الخوارزميات. في هذا العمل، نملأ هذا الفراغ من خلال تطوير نظرية مبنية على المعلومات التبادلية (mutual information theory) للتأطير العادل العميق، وبناءً عليها نصمم خوارزمية جديدة تُدعى FCMI. باختصار، من خلال تعظيم وتصغير المعلومات التبادلية، تم تصميم FCMI لتحقيق أربع خصائص مطلوبة بشدة في التجميع العادل العميق، وهي: مجموعات متماسكة، متوازنة، عادلة، بالإضافة إلى ميزات مفيدة. إلى جانب المساهمات في الجانب النظري والخوارزمي، تتمثل إحدى المساهمات الأخرى في هذا العمل في اقتراح مقياس جديد لتقييم التجميع العادل، مبني على نظرية المعلومات. على عكس مقاييس التقييم الحالية التي تقيّم جودة التجميع والعدالة بشكل منفصل، يقيس مقياسنا الجديد جودة التجميع والعدالة معًا ككل متكامل. لاختبار فعالية الخوارزمية المقترحة FCMI، أجرينا تجارب على ستة معايير معيارية، بما في ذلك خريطة تسلسل RNA خلايا واحدة، وقارناها بـ11 طريقة حديثة من أحدث التقنيات باستخدام خمسة مقاييس. يمكن الوصول إلى الكود من خلال الرابط: \url{https://pengxi.me}.