HyperAIHyperAI
منذ 2 أشهر

f-VAEGAN-D2: إطار توليد الميزات للتعلم في أي حالة

Yongqin Xian; Saurabh Sharma; Bernt Schiele; Zeynep Akata
f-VAEGAN-D2: إطار توليد الميزات للتعلم في أي حالة
الملخص

عندما تكون البيانات التدريبية المصنفة نادرة، فإن إحدى الطرق الواعدة لتوسيع البيانات هي توليد الخصائص البصرية للتصنيفات غير المعروفة باستخدام خصائصها. لتعلم التوزيع الشرطي للخصائص في شبكات العصبونات المتشابكة (CNN)، تعتمد هذه النماذج على أزواج من خصائص الصور وخصائص الفئات. لذلك، لا يمكنها الاستفادة من وفرة العينات غير المصنفة من البيانات. في هذا البحث، نعالج مشاكل التعلم بأي عدد من الأمثلة (any-shot learning)، أي التعلم بدون أمثلة (zero-shot) والتعلم بقليل من الأمثلة (few-shot)، في إطار موحد لتوليد الخصائص يعمل في بيئتي التعلم الاستقرائي (inductive) والتعلم الاستدلالي (transductive). نطور نموذجًا مولدًا شرطيًا يجمع بين قوة النموذج التلقائي المتغير الشرطي (VAE) والنماذج المولدة التنافسية (GANs)، بالإضافة إلى ذلك، عبر مميز غير شرطي، يتعلم التوزيع الحاشدي للخصائص في الصور غير المصنفة. نظهر بشكل تجريبي أن نموذجنا يتعلم خصائص CNN ذات تمييز عالٍ لخمسة مجموعات بيانات، وهي CUB وSUN وAWA وImageNet، وأنه يحدد حالة جديدة رائدة في التعلم بأي عدد من الأمثلة، أي في بيئتي التعلم الاستقرائي والاستدلالي (المعمم) بدون أمثلة وبقليل من الأمثلة. كما نوضح أن الخصائص التي تعلمناها قابلة للتفسير: نقوم برسمها عن طريق عكسها إلى فضاء البكسل ونقدم توضيحات نصية حول سبب ارتباطها بتصنيف معين.