النمذجة التوليدية من خلال تقدير تدرجات توزيع البيانات

نقدم نموذجًا توليديًا جديدًا حيث يتم إنتاج العينات من خلال الديناميكيات لانغيفين باستخدام التدرجات المقدرة لتوزيع البيانات بواسطة تقنية مطابقة الدرجات (score matching). نظرًا لأن التدرجات قد تكون غير محددة بشكل جيد وصعبة التقدير عندما توجد البيانات على منايفذ ذات الأبعاد المنخفضة، فإننا نضيف ضوضاء غاوسية بمستويات مختلفة إلى البيانات، ونقدر الدرجات المقابلة بشكل مشترك، أي حقول المتجهات للتدرجات لتوزيع البيانات المشوّشة لكل مستويات الضوضاء. بالنسبة للعينة، نقترح ديناميكيات لانغيفين مُهدئة حيث نستخدم التدرجات المقابلة لمستويات الضوضاء المتقلصة تدريجيًا أثناء اقتراب عملية العينة من منايفذ البيانات. يسمح إطارنا هذا بتصميمات نماذج مرنة، ولا يتطلب أخذ عينات أثناء التدريب أو استخدام الأساليب المعادية، ويوفر هدف تعلم يمكن استخدامه للمقارنات النموذجية المبدئية. تنتج نماذجنا عينات مماثلة لنماذج GAN على مجموعات بيانات MNIST وCelebA وCIFAR-10، مما حقق أعلى درجة جديدة في اختبار الإنشاء (inception score) وهي 8.87 على CIFAR-10. بالإضافة إلى ذلك، نوضح أن نماذجنا تتعلم تمثيلات فعالة عبر تجارب استكمال الصور (image inpainting).