HyperAIHyperAI
منذ 2 أشهر

استغلال الجانب الثابت في التعلم الصفرى التوليدي

Jingjing Li; Mengmeng Jin; Ke Lu; Zhengming Ding; Lei Zhu; Zi Huang
استغلال الجانب الثابت في التعلم الصفرى التوليدي
الملخص

تتناول طرق التعلم الصفرية التقليدية (ZSL) عادةً تعلم تمثيل مدمج، مثل الخرائط البصرية-الدلالية، للتعامل مع العينات البصرية غير المرئية بطريقة غير مباشرة. في هذا البحث، نستفيد من شبكات المواجهة التوليدية (GANs) ونقترح طريقة جديدة تُسمى LisGAN (استغلال الجانب الثابت لـ GAN)، والتي يمكنها إنشاء الخصائص غير المرئية مباشرة من الضوضاء العشوائية التي يتم تحديدها بواسطة الوصف الدلالي. بصفة خاصة، نقوم بتدريب شبكات Wasserstein التوليدية المشروطة، حيث يقوم المولد بإنشاء خصائص غير مرئية مزيفة من الضوضاء والتمييز بين المزيف والحقيقي عبر لعبة الـ minimax.باعتبار أن وصفًا دلاليًا واحدًا يمكن أن يتوافق مع مجموعة متنوعة من العينات البصرية المصنعة، وأن الوصف الدلالي، بشكل مجازي، هو روح الخصائص المنشأة، نقدم في هذا البحث ما يُعرف بالعينات الروحانية كجانب ثابت للتعلم الصفرية التوليدي. العينة الروحانية هي التمثيل الأعلى لمجموعة واحدة. إنها تصور الجوانب الأكثر دلالة على المستوى الدلالي لكل عينة ضمن نفس الفئة. نقوم بتقييد كل عينة منشأة (وهي الجانب المتغير للتعلم الصفرية التوليدي) لتكون قريبة من عينة روحانية واحدة على الأقل (الجانب الثابت) التي تحمل نفس تصنيفها.في مرحلة التعرف الصفرية، نقترح استخدام تصنيفين يتم تنفيذهما بطريقة متسلسلة لتحقيق نتيجة تدريجية من العامة إلى الخاصة. تؤكد التجارب على خمسة مقاييس شائعة أن أسلوبنا المقترح يمكنه تحقيق تفوق كبير على أفضل الأساليب الحالية بتحسينات كبيرة.