HyperAIHyperAI
منذ 17 أيام

طبقة تحويل تمثيل عالمية لتصنيف الصور بكمية قليلة من الأمثلة

Lu Liu, William Hamilton, Guodong Long, Jing Jiang, Hugo Larochelle
طبقة تحويل تمثيل عالمية لتصنيف الصور بكمية قليلة من الأمثلة
الملخص

يهدف التصنيف القائم على أمثلة قليلة (Few-shot classification) إلى التعرف على فئات غير مرئية عند عرضها بمجرد عدد قليل من الأمثلة. نحن ننظر إلى مشكلة التصنيف الصوتي الصوري القائم على أمثلة قليلة متعددة النطاقات، حيث تأتي الفئات غير المرئية وأمثلتها من مصادر بيانات متنوعة. وقد شهدت هذه المشكلة اهتمامًا متزايدًا، وقد دفعت إلى تطوير معايير تقييم مثل Meta-Dataset. ومن أبرز التحديات في هذا السياق متعدد النطاقات هو دمج التمثيلات المميزة بشكل فعّال من مجموعة متنوعة من النطاقات التدريبية. هنا، نقترح طبقة تُسمى "مُحول التمثيل الشامل" (Universal Representation Transformer أو URT)، التي تتعلم بشكل متعدد (meta-learns) للاستفادة من الميزات الشاملة في التصنيف القائم على أمثلة قليلة من خلال إعادة توزيع ديناميكية وتركيب التمثيلات الأكثر ملاءمة الخاصة بكل نطاق. وفي التجارب، نظهر أن URT تحقق نتيجة جديدة على مستوى الحد الأقصى في Meta-Dataset، حيث تحقق الأداء المتفوق على أكبر عدد من مصادر البيانات مقارنة بالطرق المنافسة. كما نقوم بتحليل نسخ مختلفة من URT، ونقدم تصورًا لخرائط حرارة درجات الانتباه التي تُوضّح كيفية أداء النموذج في التعميم عبر النطاقات. يُمكن الاطلاع على الكود الخاص بنا عبر الرابط: https://github.com/liulu112601/URT.