تعزيز تعلم التمثيل البصري التمييزي باستخدام مزيج غير مُعتمد على السيناريو

يُعدّ ميكسوب (Mixup) تقنية معروفة للتكبير المعتمد على البيانات لشبكات التعلم العميق (DNNs)، ويتكون من مهام فرعيتين: توليد ميكسوب والتصنيف. ومع ذلك، فإن الطريقة السائدة الحديثة للتدريب المباشر تُقيّد ميكسوب بالتعلم المراقب (SL)، وتحدد هدف المهمة الفرعية للتوليد بزوجين من العينات المختارة فقط، بدلاً من التماسك الكلي لسطح البيانات (data manifold)، مما قد يؤدي إلى حلول تافهة. لتجاوز هذه القيود، نقوم بدراسة شاملة لهدف توليد ميكسوب ونُقدّم طريقةً جديدة تُسمى Scenario-Agnostic Mixup (SAMix) تُطبّق في كل من سيناريوهات التعلم المراقب (SL) والتعلم الذاتي (SSL). وبشكل خاص، نُفترض ونُثبت أن دالة الهدف لتوليد ميكسوب تتمثّل في تحسين السلسّة المحلية بين فئتين مُختلطتين، مع الحفاظ على التمييز العالمي عن باقي الفئات. بناءً على ذلك، نُقدّم خسارة ميكسوب متوازنة بمعامل $η$ لتمكين التعلم المتكامل للهدفين الفرعيين. في الوقت نفسه، نصمم شبكة فرعية لتوليد العينات دون استخدام التسميات (label-free generation sub-network)، التي توفر بشكل فعّال عينات ميكسوب غير تافهة وتحسّن قدرة التحويل (transferable abilities). علاوةً على ذلك، ولتقليل التكلفة الحسابية للتدريب المباشر، نُقدّم نسخة مُدرّبة مسبقًا تُسمى SAMix$^\mathcal{P}$، التي تحقق كفاءة وعامة أفضل. أظهرت تجارب واسعة على تسعة معايير للتعلم المراقب والتعلم الذاتي تفوقًا متسقًا وتنوعًا في الأداء لطريقة SAMix مقارنةً بالطرق الحالية.