تعلم التمثيلات البصرية للتعلم الناقل من خلال كبح النسيج

أظهرت الدراسات الحديثة أن الميزات المستخلصة من التدريب المراقب لشبكات CNN قد تُبالغ في التركيز على النسيج بدلاً من ترميز المعلومات عالية المستوى. وبشكل خاص في التعلم الذاتي، قد يُقدِّم النسيج كمؤشر منخفض المستوى طرقًا مختصرة تمنع الشبكة من تعلم تمثيلات أعلى مستوى. ولحل هذه المشكلات، نقترح استخدام طرق كلاسيكية تعتمد على التشتت غير المتجانس لتعزيز التدريب باستخدام صور يتم فيها تقليل النسيج. يساعد هذا الأسلوب البسيط على الحفاظ على معلومات الحواف المهمة وتقليل النسيج في الوقت نفسه. ونُظهر تجريبيًا أن طريقة التمثيل لدينا تحقق نتائج من أفضل النتائج على مستوى الحالة في مهام كشف الكائنات وتصنيف الصور، باستخدام ثمانية مجموعات بيانات متنوعة في مهام التعلم المراقب أو الذاتي مثل MoCoV2 وJigsaw. وتُظهر طريقة التمثيل لدينا فعالية خاصة في مهام التعلم الناقل، حيث لاحظنا تحسين الأداء على خمس مجموعات بيانات قياسية للتعلم الناقل. وتشير التحسينات الكبيرة (تصل إلى 11.49٪) على مجموعة بيانات Sketch-ImageNet ومجموعة بيانات DTD، بالإضافة إلى التحليلات البصرية الإضافية باستخدام خرائط التميز، إلى أن منهجنا يساعد في تعلم تمثيلات أفضل يمكن نقلها بشكل أكثر فعالية.