HyperAIHyperAI

Command Palette

Search for a command to run...

مخطط عينة وتدريب مُحَفَّز بالانتروبيا للاستGeneration التمايزية الشرطية

Shengming Li Guangcong Zheng Hui Wang Taiping Yao Yang Chen Shoudong Ding Xi Li

الملخص

نموذج التوليد الصوتي الاحتمالي التفريقي (Denoising Diffusion Probabilistic Model - DDPM) قادر على إنجاز توليد صور شرطي مرنة من الضوضاء السابقة إلى البيانات الحقيقية، وذلك من خلال إدخال تصنيفية مستقلة تدرك الضوضاء (noise-aware classifier) لتوفير دليل تدرج شرطي في كل خطوة زمنية من عملية إزالة الضوضاء. ومع ذلك، نظرًا لقدرة هذه التصنيفية على التمييز بسهولة بين صورة غير مكتملة التوليد فقط بناءً على البنية عالية المستوى، فإن التدرج — الذي يُعد نوعًا من التوجيه المبني على المعلومات الفئوية — يميل إلى الاندثار مبكرًا، ما يؤدي إلى انهيار عملية التوليد الشرطي إلى عملية غير شرطية. ولحل هذه المشكلة، نقترح طريقتين بسيطتين ولكن فعّالتين من منظورين مختلفين. بالنسبة لعملية العينة، نُقدّم الانتروبيا (entropy) لتوزيع التنبؤ كمقياس لمستوى انعدام التوجيه، ونُقترح طريقة تدريجية تأخذ بعين الاعتبار الانتروبيا لاستعادة تلقائية للتوجيه الدلالي الشرطي. أما في مرحلة التدريب، فنُقترح أهداف تحسين تأخذ بعين الاعتبار الانتروبيا لتخفيف التنبؤات الزائدة في الثقة بالنسبة للبيانات المشوّشة. وعلى مجموعة بيانات ImageNet1000 بحجم 256x256، وباستخدام الخطة المقترحة لعملية العينة والتصنيفية المدربة، تمكّن النموذج المُدرّب مسبقًا للنماذج الشرطية وغير الشرطية من تحقيق تحسين في مؤشر FID بنسبة 10.89% (من 4.59 إلى 4.09) و43.5% (من 12 إلى 6.78) على التوالي. يمكن الاطلاع على الكود من خلال الرابط التالي: https://github.com/ZGCTroy/ED-DPM.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp