HyperAIHyperAI
منذ 11 أيام

RandAugment: تحسين تلقائي عملي للبيانات مع فضاء بحث مُختَصر

Ekin D. Cubuk, Barret Zoph, Jonathon Shlens, Quoc V. Le
RandAugment: تحسين تلقائي عملي للبيانات مع فضاء بحث مُختَصر
الملخص

أظهرت الدراسات الحديثة أن تكبير البيانات (Data Augmentation) يمتلك القدرة على تحسين التعميم بشكل كبير في نماذج التعلم العميق. ومؤخرًا، أدت استراتيجيات التكبير الآلي إلى نتائج رائدة في مجال تصنيف الصور والكشف عن الكائنات. وعلى الرغم من أن هذه الاستراتيجيات تم تحسينها لتعزيز الدقة على مجموعة التحقق، إلا أنها أنتجت أيضًا نتائج رائدة في التعلم شبه المراقب، وحسّنت المقاومة تجاه التشوهات الشائعة في الصور. ومع ذلك، يمثل المرحلة المنفصلة للبحث عن الاستراتيجيات عائقًا أمام اعتماد هذه الأساليب على نطاق واسع، إذ تزيد من تعقيد التدريب وقد ترفع التكلفة الحاسوبية بشكل كبير. علاوةً على ذلك، بسبب هذه المرحلة المنفصلة، تُعجز هذه الأساليب عن تعديل قوة الت régularization (التنظيم) استنادًا إلى حجم النموذج أو مجموعة البيانات. غالبًا ما يتم اكتشاف سياسات التكبير الآلي من خلال تدريب نماذج صغيرة على مجموعات بيانات صغيرة، ثم تطبيقها لتدريب نماذج أكبر. في هذه الدراسة، نزيل كلا العائقين. يتميز راندأوغمنت (RandAugment) بفضاء بحث مختزل بشكل كبير، مما يسمح له بالتدريب مباشرةً على المهمة المستهدفة دون الحاجة إلى مهمة بديلة منفصلة. علاوةً على ذلك، وبفضل مُعاملات التخصيص (parameterization)، يمكن تكييف قوة التنظيم وفقًا لحجم النموذج أو مجموعة البيانات المختلفة. يُمكن استخدام راندأوغمنت بشكل موحد عبر مختلف المهام ومجموعات البيانات، ويعمل فور تطبيقه دون الحاجة إلى تعديلات إضافية، ويُحقق أداءً مماثلًا أو أفضل من جميع الطرق السابقة في مجموعات بيانات CIFAR-10/100 وSVHN وImageNet. وفي مجموعة بيانات ImageNet، حققنا دقة قدرها 85.0%، أي زيادة قدرها 0.6% مقارنة بالحالة الراهنة السابقة، وزيادة قدرها 1.0% مقارنة بالاعتماد على التكبير القياسي. وفي مهام الكشف عن الكائنات، حقق راندأوغمنت تحسنًا قدره 1.0–1.3% مقارنة بالاعتماد على التكبير القياسي، ويقع ضمن فجوة 0.3% في مقياس mAP مقارنة بـ AutoAugment على مجموعة بيانات COCO. وأخيرًا، وبفضل المعلمة القابلة للتفسير، يمكن لـ راندأوغمنت أن يستخدم في دراسة الدور الذي تلعبه تكبيرات البيانات مع تغير حجم النموذج ومجموعة البيانات. وتم نشر الشفرة المصدرية على الإنترنت.