HyperAIHyperAI
منذ 18 أيام

تدريب مُوجَّه بالشرح للتصنيف قليل الأمثلة عبر المجالات

Jiamei Sun, Sebastian Lapuschkin, Wojciech Samek, Yunqing Zhao, Ngai-Man Cheung, Alexander Binder
تدريب مُوجَّه بالشرح للتصنيف قليل الأمثلة عبر المجالات
الملخص

يُعدّ تَمَيُّز التصنيف القليل التمثيل عبر المجالات (CD-FSC) مزيجًا بين تصنيف النماذج القليلة التمثيل (FSC) والمتطلبات المتعلقة بالقدرة على التعميم عبر مجالات تمثّلها مجموعات بيانات مختلفة. ويواجه هذا السياق تحديات ناتجة عن كمية البيانات المُعلَّمة المحدودة في كل فئة، بالإضافة إلى وجود انزياح المجال بين مجموعات التدريب والاختبار. في هذه الورقة، نقدّم نهجًا تدريبيًا جديدًا مُعدّلًا للنماذج الحالية لتصنيف النماذج القليلة التمثيل. ويستفيد هذا النهج من نقاط التفسير (Explanation Scores)، التي تُحسب باستخدام أساليب التفسير الحالية عند تطبيقها على توقعات نماذج FSC، وذلك بالنسبة للخرائط الوسطى للسمات (Intermediate Feature Maps) الخاصة بالنماذج. أولاً، نُعدّل طريقة الانتشار المتعلق بالطبقات (Layer-wise Relevance Propagation - LRP) لكي تُفسر توقعات نماذج FSC. ثانيًا، نطوّر استراتيجية تدريب مُوجهة بالتفسير، وليست مرتبطة بنموذج معين، تُحدّد ديناميكيًا وتُركّز على السمات المهمة للتوقعات. لا يهدف مساهمتنا إلى ابتكار طريقة تفسير جديدة، بل يكمن في تطبيق مبتكر للتفسيرات خلال مرحلة التدريب. ونُظهر أن التدريب المُوجه بالتفسير يُحسّن فعالية تعميم النموذج بشكل ملحوظ. وقد لاحظنا تحسنًا في الدقة عند تطبيق النهج على ثلاث نماذج مختلفة لتصنيف النماذج القليلة التمثيل: RelationNet، وشبكة الانتباه المتقاطعة (Cross Attention Network)، وصيغة تعتمد على الشبكات العصبية الرسومية (Graph Neural Network)، وذلك على خمس مجموعات بيانات للتعلم القليل التمثيل: miniImageNet، وCUB، وCars، وPlaces، وPlantae. يُمكن الوصول إلى كود المصدر عبر الرابط: https://github.com/SunJiamei/few-shot-lrp-guided