HyperAIHyperAI
منذ 3 أشهر

إصلاح الفجوة في الدقة بين التدريب والاختبار: FixEfficientNet

Hugo Touvron, Andrea Vedaldi, Matthijs Douze, Hervé Jégou
إصلاح الفجوة في الدقة بين التدريب والاختبار: FixEfficientNet
الملخص

يقدم هذا البحث تحليلًا شاملاً لأداء تصنيفات صور EfficientNet مع عدة إجراءات تدريب حديثة، وبخاصة إحدى هذه الإجراءات التي تصحيح الفجوة بين الصور المستخدمة في التدريب والصور المستخدمة في الاختبار. النموذج الناتج، الذي يُسمى FixEfficientNet، يتفوق بشكل ملحوظ على البنية الأصلية ذات العدد نفسه من المعلمات.على سبيل المثال، حقق FixEfficientNet-B0، الذي تم تدريبه دون استخدام بيانات تدريب إضافية، دقة بنسبة 79.3% في التصنيف الأولي (top-1) على مجموعة ImageNet باستخدام 5.3 مليون معلمة، أي تحسنًا مطلقًا بنسبة +0.5% مقارنةً بـ EfficientNet-B0 المدرّب باستخدام تقنية Noisy Student على 300 مليون صورة غير مُعلّمة. كما حقق نموذج EfficientNet-L2 المُدرّب مسبقًا باستخدام مراقبة ضعيفة على 300 مليون صورة غير مُعلّمة، ثم تم تحسينه باستخدام FixRes، دقة قدرها 88.5% في التصنيف الأولي (و88.7% في التصنيف الخامس)، وهي أرقام تُحدث حالة جديدة من التميز في ImageNet باستخدام صورة واحدة فقط.وقد تم تقييم هذه التحسينات بشكل مفصل باستخدام بروتوكولات أكثر نقاوة من تلك المتبعة عادةً في تقييم ImageNet، وتحديدًا نُظهر أن تحسيناتنا تظل قائمة في بيئة تجريبية مماثلة لـ ImageNet-v2، التي تقل فيها مخاطر التعلّم الزائد، وكذلك في حالة استخدام العلامات الحقيقية لـ ImageNet (ImageNet Real Labels). وفي الحالتين، نُحقق أيضًا حالة جديدة من التميز.