نموذج الانتشار
في التعلم الآلي،تُسمى نماذج الانتشار أيضًا بنماذج احتمالية الانتشار أو النماذج التوليدية القائمة على النتائج.إنه نوع من نموذج توليد المتغيرات الكامنة. يتكون نموذج الانتشار من ثلاثة أجزاء رئيسية: العملية الأمامية، والعملية العكسية، وعملية أخذ العينات. الهدف من نماذج الانتشار هو تعلم عملية الانتشار التي تولد توزيع الاحتمالات لمجموعة بيانات معينة. يتعلمون البنية الكامنة لمجموعة البيانات من خلال نمذجة الطريقة التي تنتشر بها نقاط البيانات في المساحة الكامنة.
من حيث الرؤية الحاسوبية، يمكن تطبيق نماذج الانتشار على مجموعة متنوعة من المهام بما في ذلك إزالة الضوضاء من الصورة، والطلاء، والدقة الفائقة، وتوليد الصور.إنها تتضمن عادة تدريب شبكة عصبية لإزالة الضوضاء المتسلسلة من الصور الضبابية بسبب الضوضاء الغاوسية. تم تدريب النموذج لعكس عملية إضافة الضوضاء إلى الصور. بعد تقارب التدريب، يمكن استخدامه لتوليد الصور، بدءًا بالصور المكونة من الضوضاء العشوائية والسماح للشبكة بإزالة الضوضاء منها بشكل متكرر. ومن الأمثلة على ذلك نموذج تحويل النص إلى صورة DALL-E 2 من OpenAI، والذي يستخدم نماذج الانتشار لكل من مسبقات النموذج (توليد تضمينات الصور مع إعطاء تعليق نصي) والفك الذي يولد الصورة النهائية. وقد وجدت نماذج الانتشار مؤخرًا تطبيقات في معالجة اللغة الطبيعية (NLP)، وخاصة في مجالات مثل إنشاء النصوص وتلخيصها.تتضمن أمثلة أطر نمذجة الانتشار الشائعة المستخدمة في الرؤية الحاسوبية نماذج احتمالية لانتشار إزالة الضوضاء، وشبكات التسجيل المشروطة بالضوضاء، والمعادلات التفاضلية العشوائية.
نماذج الانتشار مستوحاة من الديناميكا الحرارية غير المتوازنة.إنهم يقومون بتحديد سلسلة ماركوف من خطوات الانتشار لإضافة ضوضاء عشوائية ببطء إلى البيانات ثم يتعلمون كيفية عكس عملية الانتشار لبناء عينات البيانات المطلوبة من الضوضاء. على عكس نماذج VAE أو نماذج التدفق، يتم تعلم نماذج الانتشار من خلال إجراء ثابت والمتغيرات الكامنة لها أبعاد عالية (مثل البيانات الأصلية).
مراجع
【1】https://lilianweng.github.io/posts/2021-07-11-diffusion-models/