التعميم الحدودي باستخدام النماذج المُدرَّبة مسبقًا دون تكييف

إعادة ضبط النماذج المُدرّبة مسبقًا هي ممارسة شائعة في مهام التعميم المجالي (DG). ومع ذلك، غالبًا ما تكون إعادة الضبط مكلفة من حيث الحوسبة بسبب التوسع المستمر في حجم النماذج المُدرّبة مسبقًا. والأهم من ذلك، قد تؤدي إلى تعلّم مفرط (Over-fitting) في المجال المصدري، مما يضعف قدرتها على التعميم، كما أظهرت دراسات حديثة. بشكل عام، تمتلك النماذج المُدرّبة مسبقًا مستوى معين من القدرة على التعميم ويمكنها تحقيق أداء جيد في مجالات وعينات محددة. لكن الأداء التعميمي لهذه النماذج قد يختلف بشكل كبير بين مجالات الاختبار المختلفة وحتى بين العينات، مما يطرح تحديات كبيرة أمامنا في الاستفادة الأمثل من النماذج المُدرّبة مسبقًا في مهام التعميم المجالي. في هذه الورقة، نقترح نموذجًا جديدًا للتمييز المجالي يهدف إلى الاستفادة بشكل أفضل من مختلف النماذج المُدرّبة مسبقًا، ونسميه "التعلم المُجمّع المتخصص للتمييز المجالي" (SEDGE). يبدأ النموذج بتدريب مُعدّل لفضاء التسميات الخطي على نماذج مُدرّبة مسبقًا ثابتة، والذي يحوّل مخرجات النموذج المُدرّب مسبقًا إلى فضاء التسميات الخاص بالمجال المستهدف. ثم، نقترح شبكة مُجمّعة تأخذ بعين الاعتبار خصائص النماذج، لتوزيع ديناميكي للنماذج المُدرّبة مسبقًا المناسبة لتنبؤ كل عينة اختبارية. أظهرت الدراسات التجريبية على عدة معايير أداءً محسّنًا بشكل كبير مقارنةً بالأساليب القوية، بما في ذلك أحدث الطرق في مهام التعميم المجالي، مع تقليل عدد المعلمات القابلة للتدريب بنسبة تصل إلى 99%، وتقليل وقت التدريب بنسبة تصل إلى 99.5%.