طرق تكيفية للعامة المجالية المجمعة

تُعدّ التعميم النطقي (Domain Generalization) عملية تتعلّم فيها فئة تصنيف من مجموعة متنوعة من مصادر التدريب، بحيث تُعمّم على بيانات مستمدة من مجالات مستهدفة مجهولة مشابهة، وله تطبيقات واسعة في التعلم على نطاق واسع والاستنتاج الشخصي. في العديد من السياقات، تمنع مخاوف الخصوصية من الحصول على علامات المجال (domain labels) للعينات المستخدمة في التدريب، وبدلاً من ذلك تُقدَّم فقط مجموعات مجمّعة من نقاط التدريب. تُصبح الأساليب الحالية التي تعتمد على علامات المجال لخلق تمثيلات مميزة غير مرتبطة بالمجال غير قابلة للتطبيق في هذا السياق، مما يستدعي تطوير أساليب بديلة لتعلم فئات تصنيف قادرة على التعميم. في هذه الورقة، نقترح نهجًا مُعدّلًا حسب المجال (domain-adaptive) لحل هذه المشكلة، والذي يعمل على خطوتين: (أ) نُجمّع بيانات التدريب داخل فضاء مميّز مختار بعناية لإنشاء "مجالات افتراضية" (pseudo-domains)، و(ب) باستخدام هذه المجالات الافتراضية، نتعلم فئة تصنيف مُعدّلة حسب المجال، تقوم بتقديم تنبؤات باستخدام معلومات عن المدخلات وعن المجال الافتراضي الذي تنتمي إليه. يحقق نهجنا أداءً يُعدّ من أفضل الأداء في مجموعة متنوعة من معايير التعميم النطقي دون استخدام أي علامات مجال على الإطلاق. علاوةً على ذلك، نقدّم ضمانات نظرية جديدة للتمييز النطقي باستخدام معلومات التجميع. يُعدّ هذا النهج مناسبًا للأساليب القائمة على التجميع (ensemble-based)، ويُحقق مكاسب كبيرة حتى على مجموعات بيانات معايير ضخمة. يمكن الوصول إلى الشيفرة من خلال: https://github.com/xavierohan/AdaClust_DomainBed