منذ 2 أشهر
غرافيت: تعلم تمثيلات الصور الدقيقة باستخدام التسميات الخشنة
Touvron, Hugo ; Sablayrolles, Alexandre ; Douze, Matthijs ; Cord, Matthieu ; Jégou, Hervé

الملخص
يتعامل هذا البحث مع مشكلة تعلم تمثيل أكثر دقة من ذلك الذي توفره علامات التدريب. وهذا يمكّن من استرجاع فئات دقيقة للصور في مجموعة مُشَرَّحة بعلامات خشنة فقط. يتم تعلم شبكتنا باستخدام هدف تصنيف الجار الأقرب، وخسارة نموذجية مستوحاة من التعلم الذاتي المشرف (self-supervised learning). عن طريق الاستفادة المشتركة من العلامات الخشنة والفضاء الكامن الدقيق الأساسي، فإنها تحسن بشكل كبير دقة طرق استرجاع الفئات. تتفوق استراتيجيتنا على جميع الطرق المنافسة في استرجاع أو تصنيف الصور بدقة أكبر مما هو متاح خلال مرحلة التدريب. كما أنها تحسن الدقة في مهام التعلم النقل إلى مجموعات بيانات ذات فئات دقيقة، مما يجعلها تحدد الحالة الجديدة للفن (state of the art) في خمسة مقاييس عامة، مثل iNaturalist-2018.