SnapMix: خلط متناسب من حيث الدلالة لتعزيز البيانات الدقيقة

أثبتت تقنية خلط البيانات (Data mixing augmentation) فعاليتها في تدريب النماذج العميقة. تعتمد الطرق الحديثة على خلط التصنيفات بشكل رئيسي بناءً على نسبة بكسلات الصورة. وبما أن المعلومات التمييزية الرئيسية للصور ذات التفصيل الدقيق تكمن عادةً في مناطق دقيقة، فإن الطرق التي تتبع هذا النهج عرضة لحدوث ضوضاء عالية في التصنيف عند التعرف على الصور ذات التفاصيل الدقيقة. في هذا البحث، نقترح خطة جديدة تُسمى "خلط متناسب بمعني (Semantically Proportional Mixing - SnapMix)"، والتي تستخدم خريطة تنشيط الفئة (Class Activation Map - CAM) لتقليل ضوضاء التصنيف أثناء معالجة البيانات ذات التفاصيل الدقيقة. تعتمد SnapMix على تقدير التركيب المعنوي الداخلي للصورة المختلطة لتحديد التصنيف المستهدف، وتمكّن من عمليات خلط غير متماثلة وتحافظ على التوافق المعنوي بين الصور الاصطناعية والتصنيفات المستهدفة. أظهرت التجارب أن طريقة الاقتراح تتفوق بشكل ثابت على الطرق القائمة على الخلط في مجموعة متنوعة من قواعد البيانات وبأعماق مختلفة للشبكات. علاوةً على ذلك، وباستخدام الميزات المتوسطة المستوى، تحقق SnapMix أداءً من الدرجة الأولى، مما يدل على إمكانية استخدامها كأساس قوي للتعريف بالصور ذات التفاصيل الدقيقة. يمكن الوصول إلى الشفرة المصدرية للبحث من خلال الرابط التالي: https://github.com/Shaoli-Huang/SnapMix.git.