HyperAIHyperAI
منذ 2 أشهر

تعزيز تصنيف الصور بقليل من العينات من خلال التضمين متعدد المقياس القابل للتعلم وآليات الانتباه

Askari, Fatemeh ; Fateh, Amirreza ; Mohammadi, Mohammad Reza
تعزيز تصنيف الصور بقليل من العينات من خلال التضمين متعدد المقياس القابل للتعلم وآليات الانتباه
الملخص

في سياق التصنيف بقليل من العينات (few-shot classification)، الهدف هو تدريب مصنف باستخدام عدد محدود من العينات مع الحفاظ على أداء مرضٍ. ومع ذلك، فإن الأساليب التقليدية القائمة على المقاييس تظهر بعض القيود في تحقيق هذا الهدف. تعتمد هذه الأساليب عادةً على قيمة المسافة الواحدة بين الميزة الاستفسارية (query feature) والميزة الداعمة (support feature)، مما يؤدي إلى إغفال مساهمة الميزات السطحية. لتجاوز هذا التحدي، نقترح في هذا البحث نهجًا جديدًا. يشمل نهجنا استخدام شبكة تمثيل متعددة الإخراج (multi-output embedding network) تقوم بتحويل العينات إلى فضاءات ميزات مختلفة. يُستخرج المتجهات المميزة في مراحل مختلفة، مما يمكّن النموذج من التقاط الميزات العالمية وال مجردة. من خلال استخدام هذه الفضاءات المتعددة للميزات، يتم تحسين أداء النموذج. بالإضافة إلى ذلك، فإن استخدام آلية انتباه ذاتي (self-attention mechanism) يحسن تنقيح الميزات في كل مرحلة، مما يؤدي إلى تمثيلات أكثر قوة وأداء أفضل بشكل عام. كما أن تعيين أوزان قابلة للتعلم لكل مرحلة قد أدى إلى تحسين كبير في الأداء والنتائج. أجرينا تقييمات شاملة على مجموعتي البيانات MiniImageNet وFC100، وبشكل خاص في سيناريوهات 5-طريقة 1-عينة (5-way 1-shot) و5-طريقة 5-عينة (5-way 5-shot). بالإضافة إلى ذلك، أجرينا مهمات عبر المجالات على ثماني مجموعات بيانات مرجعية، حققنا فيها دقة عالية في مجالات الاختبار. تظهر هذه التقييمات فعالية الطريقة المقترحة لدينا بالمقارنة مع الأساليب الرائدة حاليًا. https://github.com/FatemehAskari/MSENet