HyperAIHyperAI
منذ 11 أيام

تقسيم والتمايز: تعلم ذاتي من بيانات غير مُنظَّمة

Yonglong Tian, Olivier J. Henaff, Aaron van den Oord
تقسيم والتمايز: تعلم ذاتي من بيانات غير مُنظَّمة
الملخص

تُعدّ التعلّم الذاتي المُشَجّع واعدًا في استغلال كمّ كبير من البيانات غير المُسَمّاة، ومع ذلك فإن معظم تقدّم هذا المجال حتى الآن كان محدودًا بالبيانات التدريبية المُعدّة بعناية شديدة مثل ImageNet. نستعرض تأثير التعلّم التمييزي من مجموعات بيانات صور أكبر وأقل تقييمًا مثل YFCC، ونجد أن هناك فرقًا كبيرًا في جودة التمثيل الناتجة. ونفترض أن هذه الفجوة في التقييم ناتجة عن تغيّر في توزيع فئات الصور — الذي يكون أكثر تنوعًا وذو توزيع طويل الذيل — مما يؤدي إلى عيّنات سلبية أقل صلة للاستفادة منها في التعلّم. ونختبر هذا الافتراض من خلال منهج جديد يُسمّى "قسم وتميّز" (DnC)، الذي يتناوب بين التعلّم التمييزي وتعدين العينات السلبية الصعبة القائمة على التجميع. وعند تدريبه على مجموعات بيانات أقل تقييمًا، يُحسّن DnC بشكل كبير أداء التعلّم الذاتي المُشَجّع في المهام التالية، مع الحفاظ على التنافسية مع أحدث النماذج المُتقدمة على مجموعات البيانات المُقيّمة بعناية.

تقسيم والتمايز: تعلم ذاتي من بيانات غير مُنظَّمة | أحدث الأوراق البحثية | HyperAI