CutMix: استراتيجية تنظيمية لتدريب تصنيفات قوية ذات خصائص قابلة للتخصيص

تم اقتراح استراتيجيات الإفلات الإقليمي لتحسين أداء تصنيفات الشبكات العصبية المتشابكة. وقد أثبتت فعاليتها في توجيه النموذج إلى التركيز على الأجزاء الأقل تمييزًا من الأشياء (مثل الساق بدلاً من الرأس للشخص)، مما يسمح للشبكة بالعمومية بشكل أفضل وامتلاك قدرات أفضل في تحديد موقع الأشياء. من ناحية أخرى، تقوم الطرق الحالية للإفلات الإقليمي بإزالة البكسل المعلوماتية من الصور التدريبية عن طريق وضع بقع سوداء أو ضوضاء عشوائية. هذه الإزالة غير مرغوب فيها لأنها تؤدي إلى فقدان المعلومات وعدم الكفاءة أثناء التدريب. لذلك، نقترح استراتيجية التعزيز CutMix: يتم قطع وإلصاق البقع بين الصور التدريبية حيث يتم خلط العلامات الحقيقية بنسبة متناسبة مع مساحة البقع. من خلال الاستخدام الفعال لبكسلات التدريب والحفاظ على تأثير التنظيم للإفلات الإقليمي، فإن CutMix يتفوق باستمرار على استراتيجيات التعزيز الأكثر تقدمًا في مهام تصنيف CIFAR و ImageNet، وكذلك في مهمة تحديد موقع ImageNet بشكل ضعيف تحت إشراف. بالإضافة إلى ذلك، على عكس طرق التعزيز السابقة، فإن تصنيف ImageNet الذي تم تدريبه باستخدام CutMix، عند استخدامه كنموذج مسبق التدريب، يؤدي إلى زيادة ثابتة في أداء مقاييس الكشف Pascal ووصف الصور MS-COCO. كما نظهر أن CutMix يحسن صلابة النموذج ضد تشوهات المدخلات وأدائه في الكشف خارج التوزيع. يمكن الحصول على شفرة المصدر والأنماط المسبقة التدريب من https://github.com/clovaai/CutMix-PyTorch .