HyperAIHyperAI

Command Palette

Search for a command to run...

نماذج التشتت الموجي هي مُولّدات صور سريعة وقابلة للتوسع

Hao Phung Quan Dao Anh Tran

الملخص

تُعد نماذج الانتشار (Diffusion models) حلًا قويًا يبرز في مجال إنشاء الصور عالي الوضوح، حيث تتفوق في الجودة على نماذج الشبكات التوليديّة التنافسية (GANs) في العديد من الحالات. ومع ذلك، فإن سرعة التدريب والاستنتاج البطيئة تمثل عقبة كبيرة تمنع استخدامها في التطبيقات الزمنية الحقيقية. وقد قدمت طريقة DiffusionGAN الحديثة تقليلًا كبيرًا في زمن التشغيل من خلال خفض عدد خطوات العينة من الآلاف إلى بضع خطوات فقط، ولكن ما زالت سرعتها تظل متأخرة بشكل كبير مقارنة بنماذج GAN. ويهدف هذا البحث إلى تقليل الفجوة في السرعة من خلال اقتراح.scheme جديد مبني على التحويل الموجي (wavelet-based diffusion scheme). حيث نستخرج المكونات ذات التردد المنخفض والمرتفع من كل من الصورة والمستويات المميزة باستخدام التحليل الموجي، ونُطبّق معالجة تكيفية لهذه المكونات لتسريع المعالجة مع الحفاظ على جودة الإنشاء الممتازة. علاوةً على ذلك، نقترح استخدام مصطلح إعادة البناء (reconstruction term)، الذي يعزز بشكل فعّال من تقارب عملية تدريب النموذج. وأثبتت النتائج التجريبية على مجموعات بيانات CelebA-HQ، CIFAR-10، LSUN-Church، وSTL-10 أن حلنا يُعد خطوة أساسية نحو توفير نماذج انتشار زمنية حقيقية وعالية الدقة. يتوفر كودنا والنقاط المُدرّبة مسبقًا على الرابط: \url{https://github.com/VinAIResearch/WaveDiff.git}.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp