ESPT: مهمة سابقة فضائية دورية ذاتية التدريب لتحسين التعلم القليل

تم دمج تقنيات التعلم ذاتي التوجيه (SSL) مؤخرًا في إطار التعلم بعينات قليلة (FSL)، وأظهرت نتائج واعدة في تحسين أداء تصنيف الصور في سياق التعلم بعينات قليلة. ومع ذلك، فإن النماذج الحالية للتعلم ذاتي التوجيه المستخدمة في FSL تسعى عادةً إلى إشارات توجيهية من التضمينات العالمية لكل صورة على حدة. وبالتالي، خلال عملية التدريب بالإيبسود (episodic training) في FSL، لا يمكن لهذه الأساليب التقاط المعلومات البصرية المحلية بكفاءة من عينات الصور، ولا الاستفادة الكاملة من معلومات البنية الهيكلية للإيبسود بأكمله، والتي تُعد مفيدة لتحسين الأداء في FSL. ولحل هذه المشكلة، نقترح تعزيز هدف التعلم بعينات قليلة من خلال مهمة مسبقة مكانيّة إيبسودية ذاتية التوجيه (ESPT) جديدة. بشكل محدد، لكل إيبسود من التعلم بعينات قليلة، نُنشئ إيبسودًا محولًا مُقابلًا من خلال تطبيق تحويل هندسي عشوائي على جميع الصور داخل هذا الإيبسود. بناءً على ذلك، يتم تعريف هدف ESPT على أنه تحسين الاتساق في العلاقات المكانية المحلية بين الإيبسود الأصلي والإيبسود المحول. وباستخدام هذا التعريف، يُعزز الهدف المُعزز بـ ESPT تعلم تمثيلات مميزة قابلة للانتقال بشكل أفضل، والتي تلتقط الخصائص المكانية المحلية المختلفة بين الصور، فضلًا عن معلومات البنية الترابطية بينها داخل كل إيبسود مدخل، مما يمكّن النموذج من التعميم بشكل أفضل على فئات جديدة باستخدام عدد قليل جدًا من العينات. تُظهر التجارب الواسعة أن طريقة ESPT التي نقترحها تحقق أداءً جديدًا على مستوى الحد الأقصى من الأداء في تصنيف الصور بعينات قليلة على ثلاث مجموعات معيارية رئيسية للبيانات. سيتم إتاحة الشفرة المصدرية على: https://github.com/Whut-YiRong/ESPT.