التكيف بين المجالات غير المراقب من خلال التجميع التمييزي المُستخلص

تُعالج التكيف غير المراقب للنطاق مشكلة تصنيف البيانات في نطاق مستهدف غير مُعلَّم، بالاعتماد على بيانات مصدر مُعلَّمة والتي تشارك نفس الفضاء التصنيفي ولكن تتبع توزيعًا مختلفًا. تتخذ معظم الطرق الحديثة نهجًا يتمثل في محاذاة توزيعات الميزات بشكل صريح بين النطاقين. وخلافًا لذلك، مستلهمين من الافتراض الأساسي الخاص بالقدرة على التكيف بين النطاقات، نعيد صياغة مشكلة التكيف بين النطاقات كـ"تجميع تمييزي للبيانات المستهدفة"، مع الأخذ بعين الاعتبار معلومات مُفضَّلة قوية تُقدَّم من خلال بيانات المصدر المُعلَّمة المرتبطة ارتباطًا وثيقًا. من الناحية التقنية، نستخدم أهداف تجميع تعتمد على نسخة مقاومة لعوامل الانتروبيا المُقلَّلة، التي تقوم بتصفية تلقائية للبيانات المستهدفة، وتمامًا مثل معيار فيشر المُشابه، بالإضافة إلى ترتيب المجموعات من خلال تصنيف المراكز. ولإدخال المعلومات التمييزية المُستخلصة من البيانات المصدرية إلى تجميع البيانات المستهدفة، نقترح تدريب الشبكة بشكل مشترك باستخدام أهداف تعليم مراقبة متوازية على بيانات المصدر المُعلَّمة. نُسمّي طريقة التجميع التمييزي المستخلص للتكيف بين النطاقات بـ"DisClusterDA". كما نقدم تفسيرًا هندسيًا يوضح كيف تساعد الأهداف المكوِّنة لـDisClusterDA على تعلُّم توزيعات ميزات متميزة ومتقاربة من حيث الفئة. أجرينا دراسات تحليلية دقيقة وتجارب واسعة على خمسة مجموعات بيانات شهيرة، بما في ذلك مجموعة بيانات تكيف متعددة المصادر. وباستخدام الشبكات الأساسية الشائعة، تتفوَّق DisClusterDA على الطرق الحالية في هذه المجموعات. ومن المثير للاهتمام أيضًا ملاحظة أن إضافة حدّة خسارة إضافية في إطارنا الخاص بـDisClusterDA، والتي تهدف صراحةً إلى محاذاة توزيعات الميزات على مستوى الفئة بين النطاقات، تؤدي إلى تدهور أداء التكيف، رغم الحاجة إلى دراسات أكثر دقة في أطر خوارزمية مختلفة.