HyperAIHyperAI
منذ 15 أيام

مخطط عينة وتدريب مُحَفَّز بالانتروبيا للاستGeneration التمايزية الشرطية

Shengming Li, Guangcong Zheng, Hui Wang, Taiping Yao, Yang Chen, Shoudong Ding, Xi Li
مخطط عينة وتدريب مُحَفَّز بالانتروبيا للاستGeneration التمايزية الشرطية
الملخص

نموذج التوليد الصوتي الاحتمالي التفريقي (Denoising Diffusion Probabilistic Model - DDPM) قادر على إنجاز توليد صور شرطي مرنة من الضوضاء السابقة إلى البيانات الحقيقية، وذلك من خلال إدخال تصنيفية مستقلة تدرك الضوضاء (noise-aware classifier) لتوفير دليل تدرج شرطي في كل خطوة زمنية من عملية إزالة الضوضاء. ومع ذلك، نظرًا لقدرة هذه التصنيفية على التمييز بسهولة بين صورة غير مكتملة التوليد فقط بناءً على البنية عالية المستوى، فإن التدرج — الذي يُعد نوعًا من التوجيه المبني على المعلومات الفئوية — يميل إلى الاندثار مبكرًا، ما يؤدي إلى انهيار عملية التوليد الشرطي إلى عملية غير شرطية. ولحل هذه المشكلة، نقترح طريقتين بسيطتين ولكن فعّالتين من منظورين مختلفين. بالنسبة لعملية العينة، نُقدّم الانتروبيا (entropy) لتوزيع التنبؤ كمقياس لمستوى انعدام التوجيه، ونُقترح طريقة تدريجية تأخذ بعين الاعتبار الانتروبيا لاستعادة تلقائية للتوجيه الدلالي الشرطي. أما في مرحلة التدريب، فنُقترح أهداف تحسين تأخذ بعين الاعتبار الانتروبيا لتخفيف التنبؤات الزائدة في الثقة بالنسبة للبيانات المشوّشة. وعلى مجموعة بيانات ImageNet1000 بحجم 256x256، وباستخدام الخطة المقترحة لعملية العينة والتصنيفية المدربة، تمكّن النموذج المُدرّب مسبقًا للنماذج الشرطية وغير الشرطية من تحقيق تحسين في مؤشر FID بنسبة 10.89% (من 4.59 إلى 4.09) و43.5% (من 12 إلى 6.78) على التوالي. يمكن الاطلاع على الكود من خلال الرابط التالي: https://github.com/ZGCTroy/ED-DPM.

مخطط عينة وتدريب مُحَفَّز بالانتروبيا للاستGeneration التمايزية الشرطية | أحدث الأوراق البحثية | HyperAI