نموذج التوزيع الخاص بك هو تصنيف آلي بدون تعلم مسبق

الموجة الأخيرة من نماذج التوسيع النصية إلى الصورية ذات الحجم الكبير قد أثرت بشكل كبير في قدراتنا على توليد الصور بناءً على النص. يمكن لهذه النماذج إنشاء صور واقعية لمجموعة مذهلة من الأوامر وتظهر قدرات تعميم تركيبية مثيرة للإعجاب. ومع ذلك، فإن جميع الاستخدامات حتى الآن ركزت بشكل أساسي على العينات؛ ولكن، يمكن لنماذج التوسيع أيضًا توفير تقديرات كثافة شرطية، وهي مفيدة للمهام التي تتجاوز توليد الصور. في هذا البحث، نوضح أن تقديرات الكثافة من نماذج التوسيع النصية إلى الصورية ذات الحجم الكبير مثل Stable Diffusion (استقرار التوسيع) يمكن استخدامها لأداء تصنيف بدون تدريب إضافي. نهجنا الجيني للتصنيف، الذي نسميه مصنف التوسيع، يحقق نتائج قوية في مجموعة متنوعة من المعايير ويتفوق على الطرق البديلة لاستخراج المعرفة من نماذج التوسيع. رغم وجود فارق بين النهج الجيني والتمييز في مهمات التعرف بدون تدريب، فإن نهجانا القائم على التوسيع يتمتع بقدرة استدلال تركيبية متعددة الأوضاع أقوى بكثير من الطرق التنافسة القائمة على التمييز. أخيرًا، نستخدم مصنف التوسيع لاستخراج المصنفات القياسية من نماذج التوسيع الشرطية الفئوية التي تم تدريبها على ImageNet (صورة شبكة). تحقق نماذجنا أداءً تصنيفياً قويًا باستخدام فقط تعزيزات ضعيفة وتظهر مقاومة فعالة أفضل بشكل نوعي للتغير في التوزيع. بشكل عام، تعتبر نتائجنا خطوة نحو استخدام النماذج الجينية بدلاً من النماذج التمييزية للمهام اللاحقة. يمكن الوصول إلى النتائج والتصورات عبر الرابط: https://diffusion-classifier.github.io/