HyperAIHyperAI
منذ 2 أشهر

تصحيح اختلاف دقة التدريب والاختبار

Hugo Touvron; Andrea Vedaldi; Matthijs Douze; Hervé Jégou
تصحيح اختلاف دقة التدريب والاختبار
الملخص

تعتبر زيادة البيانات (Data Augmentation) من العناصر الأساسية في تدريب الشبكات العصبية للتصنيف الصوري. يظهر هذا البحث أولاً أن الزيادات الحالية تؤدي إلى اختلاف كبير بين الحجم النموذجي للأجسام التي يراها المصنف أثناء التدريب واختباره. نحن نؤكد تجريبياً أنه، بالنسبة لدقة الاختبار المستهدفة، استخدام دقة تدريب أقل يقدم أفضل تصنيف عند الاختبار.ثم نقترح استراتيجية بسيطة ومعتبرة وفعالة لتحسين أداء المصنف عندما تختلف دقة التدريب والاختبار. وتتضمن هذه الاستراتيجية فقط ضبطًا خفيفًا للمشبك عددياً (computationally cheap fine-tuning) للشبكة عند دقة الاختبار. هذا يمكّن من تدريب مصنفات قوية باستخدام صور تدريب صغيرة. على سبيل المثال، نحصل على دقة تصنيف 77.1٪ في المرتبة الأولى على ImageNet باستخدام ResNet-50 مدرب على صور بحجم 128x128 بكسل، ونسبة 79.8٪ مع واحد مدرب على صور بحجم 224x224 بكسل. بالإضافة إلى ذلك، إذا استخدمنا بيانات تدريب إضافية، فسنحصل على نسبة 82.5٪ مع ResNet-50 مدرب على صور بحجم 224x224 بكسل.على الجانب الآخر، عند تدريب ResNeXt-101 32x48d بشكل شبه مشرف (weakly-supervised) على 940 مليون صورة عامة بدقة 224x224 بكسل ثم تعظيم الأداء لدقة الاختبار 320x320 بكسل، نحصل على دقة تصنيف في المرتبة الأولى بلغت 86.4٪ (في المرتبة الخامسة: 98.0٪) (مع حصاد واحدة). حسب علمنا، هذه هي أعلى دقة تصنيف في ImageNet حتى الآن باستخدام حصاد واحدة وفي المرتبتين الأولى والخامسة.

تصحيح اختلاف دقة التدريب والاختبار | أحدث الأوراق البحثية | HyperAI