HyperAIHyperAI
منذ 13 أيام

TrivialAugment: تحسين بدون ضبط يُعد من أحدث تقنيات تكبير البيانات

Samuel G. Müller, Frank Hutter
TrivialAugment: تحسين بدون ضبط يُعد من أحدث تقنيات تكبير البيانات
الملخص

أصبحت طرق التكبير التلقائي (automatic augmentation) مؤخرًا عمودًا أساسيًا لأداء النماذج القوية في المهام البصرية. في حين أن الطرق الحالية للتَكبير التلقائي تتطلب تنازلًا بين البساطة والتكلفة والأداء، نقدم في هذا العمل أبسط قاعدة مقارنة (baseline) ممكنة، تُسمى TrivialAugment، والتي تفوق الطرق السابقة تقريبًا دون تكلفة كبيرة. تتميز TrivialAugment بعدم احتوائها على أي معاملات (parameter-free)، وتُطبّق نوعًا واحدًا فقط من التكبير على كل صورة. وبالتالي، كان أداء TrivialAugment مفاجئًا لنا بشكل كبير، وقد قمنا بإجراء تجارب مفصلة جدًا لدراسة أدائها. أولاً، قارنا TrivialAugment بالطرق الرائدة السابقة في سيناريوهات متعددة لتصنيف الصور. ثم قمنا بسلسلة من دراسات التحليل التجريبي (ablation studies) باستخدام فضاءات تكبير مختلفة، وطرق تكبير مختلفة، وبيئات تشغيل مختلفة، بهدف فهم المتطلبات الجوهرية لتحقيق الأداء العالي. علاوة على ذلك، قدمنا واجهة بسيطة تسهّل الاعتماد الواسع النطاق على طرق التكبير التلقائي، بالإضافة إلى توفير كامل كود المشروع لضمان إعادة الإنتاج (reproducibility). وبما أن عملنا كشف عن توقف في العديد من جوانب بحوث التكبير التلقائي، ننهي بمقترح موجز لأساليب مثلى (best practices) لضمان التقدم المستمر في هذا المجال في المستقبل.

TrivialAugment: تحسين بدون ضبط يُعد من أحدث تقنيات تكبير البيانات | أحدث الأوراق البحثية | HyperAI