HyperAIHyperAI
منذ 17 أيام

الطرق العددية الزائفة للنماذج الانتشارية على المانيفولدات

Luping Liu, Yi Ren, Zhijie Lin, Zhou Zhao
الطرق العددية الزائفة للنماذج الانتشارية على المانيفولدات
الملخص

يمكن لنموذج التوليد الاحتمالي التدرجي لتنظيف الضوضاء (DDPMs) إنتاج عينات عالية الجودة مثل الصور والصوتيات. ومع ذلك، فإن نماذج DDPM تتطلب مئات إلى الآلاف من التكرارات لإنتاج العينات النهائية. وقد نجح عدد من الدراسات السابقة في تسريع نماذج DDPM من خلال تعديل جدول التباين (مثل نماذج DDPM المحسّنة) أو معادلة إزالة الضوضاء (مثل نماذج التوليد الاحتمالي التدرجي الضمني DDIMs). ومع ذلك، فإن هذه الأساليب لا تُحافظ على جودة العينات، بل قد تُدخل ضوضاء جديدة عند معدلات تسريع عالية، مما يحد من ممارستها الفعلية. ولتسريع عملية الاستدلال مع الحفاظ على جودة العينات، نقدّم منظورًا جديدًا يُعتبر فيه نماذج DDPM كحل لمعادلات تفاضلية على المنحنيات (manifolds). وبهذا المنظور، نقترح أساليب عددية وهمية لنموذج التوليد التدرجي (PNDMs). وبشكل خاص، نحدد كيفية حل المعادلات التفاضلية على المنحنيات، ونُظهر أن نماذج DDIMs تمثل حالات بسيطة من الأساليب العددية الوهمية. ونُعيد تشكيل عدة طرق عددية كلاسيكية إلى أساليب عددية وهمية مماثلة، ونجد أن الطريقة العددية الوهمية المتعددة الخطوات الخطية هي الأفضل في معظم الحالات. ووفقًا لتجاربنا، وباستخدام نماذج مُدرّبة مسبقًا على مجموعات بيانات Cifar10 وCelebA وLSUN، يمكن لـ PNDMs إنتاج صور اصطناعية ذات جودة أعلى باستخدام 50 خطوة فقط، مقارنةً بـ 1000 خطوة في نموذج DDIMs (بمعدل تسريع 20 ضعفًا)، وتفوق بشكل كبير نموذج DDIMs باستخدام 250 خطوة (بفارق حوالي 0.4 في معيار FID)، كما تُظهر أداءً جيدًا في التعميم على جداول تباين مختلفة. يُمكن الاطلاع على التنفيذ العملي عبر الرابط: https://github.com/luping-liu/PNDM.

الطرق العددية الزائفة للنماذج الانتشارية على المانيفولدات | أحدث الأوراق البحثية | HyperAI