انظر بشكل أفضل قبل التعمق: شبكة تحسين البيانات المشرف عليها بشكل ضعيف لتصنيف الصور الدقيق

يُستخدم تكبير البيانات عادةً لزيادة كمية بيانات التدريب، منع الانطباق الزائد وتحسين أداء النماذج العميقة. ومع ذلك، في الممارسة العملية، يكون تكبير البيانات العشوائي، مثل قص الصور العشوائي، غير فعال وقد يُدخل ضوضاء خلفية غير مراقبة بكثرة. في هذا البحث، نقترح شبكة تكبير البيانات تحت الإشراف الضعيف (WS-DAN) لاستكشاف إمكانات تكبير البيانات. بصفة خاصة، لكل صورة تدريبية، نولد أولًا خرائط الانتباه لتمثيل الأجزاء التمييزية للجسم باستخدام التعلم تحت الإشراف الضعيف. ثم نقوم بتكبير الصورة بإرشاد من هذه خرائط الانتباه، بما في ذلك قص الانتباه وإسقاط الانتباه. يحسن WS-DAN المقترح دقة التصنيف بمراحل اثنين. في المرحلة الأولى، يمكن رؤية الصور بشكل أفضل حيث سيتم استخراج المزيد من الخصائص للأجزاء التمييزية. وفي المرحلة الثانية، توفر مناطق الانتباه موقع الجسم بدقة مما يضمن لموديلنا النظر إلى الجسم عن قرب وتحسين الأداء أكثر. تظهر التجارب الشاملة في مجموعات بيانات تصنيف الصور الدقيقة الشائعة أن WS-DAN الخاص بنا يتفوق على الأساليب الأكثر حداثة، مما يثبت فعاليته.