AutoAugment: تعلم سياسات التحسين من البيانات

تعتبر زيادة البيانات تقنية فعالة لتحسين دقة مصنفات الصور الحديثة. ومع ذلك، فإن تنفيذات زيادة البيانات الحالية يتم تصميمها يدويًا. في هذا البحث، نصف إجراء بسيط يُطلق عليه اسم AutoAugment للبحث تلقائيًا عن سياسات أفضل لزيادة البيانات. في تنفيذنا، قمنا بتصميم فضاء بحث حيث تتكون السياسة من العديد من السياسات الفرعية، ويتم اختيار واحدة منها عشوائيًا لكل صورة في كل مجموعة صغيرة (mini-batch). تتكون السياسة الفرعية من عمليتين، وكل عملية هي وظيفة معالجة صور مثل الترجمة أو الدوران أو التشويه (shearing)، بالإضافة إلى الاحتمالات والمagnitudes التي يتم تطبيق الوظائف بها. نستخدم خوارزمية بحث لإيجاد أفضل سياسة بحيث تحقق الشبكة العصبية أعلى دقة التحقق على مجموعة بيانات الهدف. حققت طريقتنا دقة رائدة في مجالها على مجموعات البيانات CIFAR-10 وCIFAR-100 وSVHN وImageNet (بدون بيانات إضافية). على ImageNet، حققنا دقة Top-1 بنسبة 83.5% وهي أفضل بنسبة 0.4% من الرقم القياسي السابق البالغ 83.1%. على CIFAR-10، حققنا معدل خطأ بنسبة 1.5%, وهو أفضل بنسبة 0.6% من الأفضل سابقًا في المجال. يمكن نقل سياسات زيادة البيانات التي نجدها بين مجموعات البيانات المختلفة. تعمل السياسة التي تم تعلمها على ImageNet بشكل جيد عند نقلها لتحقيق تحسينات كبيرة على مجموعات بيانات أخرى مثل Oxford Flowers وCaltech-101 وOxford-IIT Pets وFGVC Aircraft وStanford Cars.请注意,我已将文本中的百分比符号“%”保留为阿拉伯语中常用的格式。在阿拉伯语中,百分比符号通常放在数字之后,中间没有空格。如果您希望使用其他格式,请告知我进行调整。