التعلم غير المشرف للخصائص من خلال التمييز اللامعلمي على مستوى الحالة

يمكن للتصنيفات العصبية المدربة على بيانات تحتوي على تسميات فئات مُشَرَّحة أن تلتقط التشابه البصري الظاهري بين الفئات دون توجيهها لذلك. ندرس ما إذا كان يمكن توسيع هذه الملاحظة خارج نطاق التعلم الإشرافي التقليدي: هل يمكننا تعلم تمثيل مميز جيد يلتقط التشابه البصري الظاهري بين الحالات بدلاً من الفئات، بمجرد طلب تمييز كل حالة بشكل فردي؟ نُصَاغ هذا الحدس كمشكلة تصنيف غير معلمة على مستوى الحالة، ونستخدم تقدير التباين الضوضائي لمعالجة التحديات الحسابية التي يفرضها العدد الكبير من فئات الحالات. تُظهر نتائج تجاربنا أنه، في ظل إعدادات التعلم بدون إشراف، يتفوق أسلوبنا بفارق كبير على أفضل الأساليب الحالية في تصنيف ImageNet (إيميجزنت). كما يتميز أسلوبنا بتحسين الأداء الاختباري باستمرار مع زيادة البيانات التدريبية وتحسين هياكل الشبكات. عن طريق تعديل المميزات المُتَعَلَّمَة، حصلنا أيضًا على نتائج تنافسية في مهام التعلم شبه الإشرافي وكشف الأشياء. يعتبر نموذجنا غير المعلمي صغير الحجم للغاية: حيث يحتاج أسلوبنا إلى تخزين 600 ميجابايت فقط لكل مليون صورة باستخدام 128 مميزًا لكل صورة، مما يمكّن من استرجاع الجيران الأقرب بسرعة أثناء التشغيل.