SIMPLE: مطابقة النموذج-العينة المتخصصة للعامة في المجال

في مجال التعميم النطاقي (DG)، تسعى معظم الطرق الحالية إلى تحسين نموذج مُدرَّب مسبقًا معين من خلال خوارزميات جديدة للـ DG. في هذا البحث، نقترح اتجاهًا بديلًا، أي الاستفادة بكفاءة من مجموعة من النماذج المُدرَّبة مسبقًا دون الحاجة إلى تحسينها. من خلال أدلة تجريبية ونظرية واسعة، نُظهر أن (1) تمتلك النماذج المُدرَّبة مسبقًا قدرًا معينًا من القدرة على التعميم، مع عدم وجود نموذج مُدرَّب مسبقًا مثاليًا في جميع ظروف التحول التوزيعي، و(2) يعتمد خطأ التعميم خارج التوزيع (OOD) على مدى التوافق بين النموذج المُدرَّب مسبقًا والتوزيعات غير المرئية في العينة الاختبارية. تُحفّز هذه التحليلات على دمج نماذج مُدرَّبة مسبقًا متنوعة، وتمكين تقنيات التوصية من توجيه أفضل نموذج مطابق لكل عينة OOD. ولتحقيق ذلك، نُقدّم طريقة SIMPLE، وهي طريقة متخصصة لتوافق النموذج مع العينة في مجال التعميم النطاقي. أولاً، يتم تكييف توقعات النماذج المُدرَّبة مسبقًا لتتناسب مع المجال المستهدف من خلال تحويل خطي لفضاء التسميات. ثم نُقدّم شبكة تطابق تأخذ بعين الاعتبار التخصص الخاص بكل نموذج، بهدف توصية نماذج مُدرَّبة مسبقًا مناسبة بشكل ديناميكي لكل عينة اختبار. أظهرت التجارب على مجموعة بيانات DomainBed أن طريقتنا تحقق تحسينات كبيرة في الأداء (بحد أقصى 12.2% لكل مجموعة بيانات منفصلة، و3.9% متوسطًا) مقارنة بالطرق الرائدة (SOTA)، كما تحقق مكسبًا إضافيًا بنسبة 6.1% عند توسيع حجم مجموعة النماذج المُدرَّبة مسبقًا. علاوة على ذلك، تتميز طريقتنا بالكفاءة العالية، حيث تحقق مكاسبًا في سرعة التدريب تزيد عن 1000 مرة مقارنة بالطرق التقليدية للـ DG التي تعتمد على تحسين النموذج المُدرَّب مسبقًا. يمكن الوصول إلى الكود والمواد المكملة من خلال الرابط التالي: https://seqml.github.io/simple.