HyperAIHyperAI
منذ 17 أيام

نماذج التشتت الموجي هي مُولّدات صور سريعة وقابلة للتوسع

Hao Phung, Quan Dao, Anh Tran
نماذج التشتت الموجي هي مُولّدات صور سريعة وقابلة للتوسع
الملخص

تُعد نماذج الانتشار (Diffusion models) حلًا قويًا يبرز في مجال إنشاء الصور عالي الوضوح، حيث تتفوق في الجودة على نماذج الشبكات التوليديّة التنافسية (GANs) في العديد من الحالات. ومع ذلك، فإن سرعة التدريب والاستنتاج البطيئة تمثل عقبة كبيرة تمنع استخدامها في التطبيقات الزمنية الحقيقية. وقد قدمت طريقة DiffusionGAN الحديثة تقليلًا كبيرًا في زمن التشغيل من خلال خفض عدد خطوات العينة من الآلاف إلى بضع خطوات فقط، ولكن ما زالت سرعتها تظل متأخرة بشكل كبير مقارنة بنماذج GAN. ويهدف هذا البحث إلى تقليل الفجوة في السرعة من خلال اقتراح.scheme جديد مبني على التحويل الموجي (wavelet-based diffusion scheme). حيث نستخرج المكونات ذات التردد المنخفض والمرتفع من كل من الصورة والمستويات المميزة باستخدام التحليل الموجي، ونُطبّق معالجة تكيفية لهذه المكونات لتسريع المعالجة مع الحفاظ على جودة الإنشاء الممتازة. علاوةً على ذلك، نقترح استخدام مصطلح إعادة البناء (reconstruction term)، الذي يعزز بشكل فعّال من تقارب عملية تدريب النموذج. وأثبتت النتائج التجريبية على مجموعات بيانات CelebA-HQ، CIFAR-10، LSUN-Church، وSTL-10 أن حلنا يُعد خطوة أساسية نحو توفير نماذج انتشار زمنية حقيقية وعالية الدقة. يتوفر كودنا والنقاط المُدرّبة مسبقًا على الرابط: \url{https://github.com/VinAIResearch/WaveDiff.git}.