تحليل مكونات التشتت: إطار موحد للتكيف بين المجالات والعمومية بين المجالات

يتناول هذا البحث مهام التصنيف في مجال هدفي معين، حيث تكون البيانات التدريبية المصنفة متاحة فقط من مجالات مصدر مختلفة عن (لكن مرتبطة بـ) المجال الهدف. يهتم إطاران مرتبطان ارتباطًا وثيقًا بمثل هذه المهام، وهما تكيف المجال (Domain Adaptation) وتعميم المجال (Domain Generalization)، حيث الفرق الوحيد بين هذين الإطارين هو توفر البيانات غير المصنفة من المجال الهدف: يمكن لتكيف المجال استغلال المعلومات غير المصنفة من المجال الهدف، بينما لا يمكن لتعميم المجال ذلك.نقترح تحليل المكونات المتبددة (Scatter Component Analysis - SCA)، وهو خوارزمية سريعة لتعلم التمثيل يمكن تطبيقها على كل من تكيف المجال وتعميم المجال. يعتمد SCA على قياس هندسي بسيط، وهو التبدد (scatter)، الذي يعمل في فضاء هلبرت للنواة القابلة لإعادة الإنتاج. يجد SCA تمثيلاً يحقق توازنًا بين زيادة فصل الفئات، وخفض الاختلاف بين المجالات، وزيادة فصل البيانات؛ يتم تقدير كل منها من خلال التبدد. يمكن تخفيض مشكلة الأمثلة في SCA إلى مشكلة القيم الذاتية العامة، مما يؤدي إلى حل سريع ودقيق.أجريت تجارب شاملة على مجموعات بيانات مرجعية للتعرف على الأشياء عبر مجالات مختلفة أثبتت أن SCA يعمل بشكل أسرع بكثير من العديد من الخوارزميات الرائدة وأنه يقدم دقة تصنيف رائدة في كلاً من تكيف المجال وتعميم المجال. كما نوضح أن التبدد يمكن استخدامه لتأسيس حد عام نظري في حالة تكيف المجال.