HyperAIHyperAI
منذ 17 أيام

AutoMix: كشف قوة ميكسأب لتصنيفات أقوى

Zicheng Liu, Siyuan Li, Di Wu, Zihan Liu, Zhiyuan Chen, Lirong Wu, Stan Z. Li
AutoMix: كشف قوة ميكسأب لتصنيفات أقوى
الملخص

أثبتت طرق تعزيز المزج البيانات (Data mixing augmentation) فعاليتها في تحسين قدرة الشبكات العصبية العميقة على التعميم. في حين أن الطرق المبكرة قامت بدمج العينات باستخدام سياسات مصممة يدويًا (مثل التداخل الخطي)، فإن الطرق الحديثة تستخدم معلومات التمييز (saliency information) لتوافق العينات المزوجة مع التسميات من خلال عمليات تحسين معقدة مسبقة (offline optimization). ومع ذلك، تظهر تناقضًا بين دقة سياسات المزج وتعقيد عملية التحسين. لمعالجة هذه التحديات، نقترح إطارًا جديدًا تلقائيًا لعملية المزج (AutoMix)، حيث يتم تمثيل سياسة المزج باستخدام معاملات وتعمل مباشرةً على تحقيق الهدف النهائي للتصنيف. بشكل محدد، يعيد AutoMix صياغة مسألة التصنيف باستخدام المزج إلى مهام فرعية اثنتين (أي إنشاء العينات المزوجة، والتصنيف باستخدام المزج)، مع شبكة فرعية مخصصة لكل مهمة، ويحلهما ضمن إطار تحسين ثنائي المستويات (bi-level optimization). بالنسبة لإنشاء العينات، تم تصميم مُولِّد مزج خفيف القابل للتعلم، يُسمى Mix Block، لتكوين العينات المزوجة من خلال نمذجة العلاقات بين القطع (patch-wise relationships) تحت إشراف مباشر للوسوم المزوجة المقابلة. ولمنع التدهور وعدم الاستقرار الناتجين عن التحسين ثنائي المستويات، نقدم أيضًا قناة تدرج حركي (momentum pipeline) لتدريب AutoMix بطريقة نهائية (end-to-end). أظهرت تجارب واسعة على تسع معايير صورية تفوق AutoMix على أحدث الطرق في سيناريوهات تصنيف متنوعة ومهام تطبيقية لاحقة.