HyperAIHyperAI
منذ 16 أيام

مع مساعدة قليلة من أصدقائي: التعلم التبايني القريب من الجيران للتمثيلات البصرية

Debidatta Dwibedi, Yusuf Aytar, Jonathan Tompson, Pierre Sermanet, Andrew Zisserman
مع مساعدة قليلة من أصدقائي: التعلم التبايني القريب من الجيران للتمثيلات البصرية
الملخص

الخوارزميات التلقائية التعلّم القائمة على التمييز بين الحالات تُدرّب المُشفّرات لتكون غير حساسة تجاه التحويلات المحددة مسبقًا لنفس الحالة. في حين أن معظم الطرق تُعامل وجهات نظر مختلفة لنفس الصورة كعناصر إيجابية لخسارة التباين، فإننا نهتم باستخدام العناصر الإيجابية من حالات أخرى في المجموعة. تُسمّى طريقة عملنا "التعلم التبايني القائم على الجيران الأقرب لتمثيلات بصرية" (NNCLR)، حيث تُختَرَج أقرب الجيران من المجموعة في الفضاء المُخفي، وتُعامل كعناصر إيجابية. وهذا يُوفّر تنوّعًا دلاليًا أكبر مقارنة بالتحويلات المحددة مسبقًا.لقد وجدنا أن استخدام الجيران الأقرب كعناصر إيجابية في خسائر التباين يُحسّن الأداء بشكل كبير في تصنيف ImageNet، من 71.7% إلى 75.6%، متفوّقًا على الطرق السابقة الأفضل في المجال. على معايير التعلّم شبه المُراقبة، نُحسّن الأداء بشكل ملحوظ عندما تكون هناك فقط 1% من العلامات الخاصة بـ ImageNet متاحة، من 53.8% إلى 56.5%. وعلى معايير نقل التعلّم، تتفوّق طريقتنا على الطرق الأفضل في المجال (بما في ذلك التعلّم المُراقب باستخدام ImageNet) في 8 من أصل 12 مجموعة بيانات تطبيقية. علاوةً على ذلك، نُظهِر تجريبيًا أن طريقتنا تعتمد أقل على التحويلات المعقدة للبيانات. ونلاحظ انخفاضًا نسبيًا بنسبة 2.1% فقط في دقة الصورة الأولى لـ ImageNet عند التدريب باستخدام فقط القطع العشوائية.

مع مساعدة قليلة من أصدقائي: التعلم التبايني القريب من الجيران للتمثيلات البصرية | أحدث الأوراق البحثية | HyperAI