Command Palette
Search for a command to run...
HiWave: إنشاء صور ذات دقة عالية بدون تدريب عبر عينات التفتيت الموجي
Tobias Vontobel Seyedmorteza Sadat Farnood Salehi Romann M. Weber

الملخص
نماذج الانتشار (Diffusion Models) ظهرت كأفضل نهج لتكوين الصور، حيث أظهرت واقعية ضوئية استثنائية ومتنوعة. ومع ذلك، فإن تدريب هذه النماذج بدقائق عالية يظل مكلفاً من الناحية الحسابية، وتقنيات التوليد الفوري (Zero-Shot Generation) الموجودة لتكوين صور تتجاوز دقائق التدريب غالباً ما تنتج تشوهات مرئية، بما في ذلك تكرار الأشياء وعدم التجانس المكاني. في هذا البحث، نقدم HiWave، وهو نهج فوري وبدون تدريب يعزز بشكل كبير الدقة البصرية والتجانس الهيكلي في تكوين الصور بدقة فائقة باستخدام النماذج المسبقة التدريب على الانتشار. يستخدم أسلوبنا خطوتين: إنتاج صورة أساسية من النموذج المسبق التدريب، ثم خطوة عكس DDIM حسب القطعة (Patch-Wise) ووحدة تعزيز التفاصيل المستندة إلى الأمواج (Wavelet-Based Detail Enhancer). تحديداً، نستخدم أولاً طرق العكس لاستخراج متجهات الضوضاء الأولية التي تحتفظ بالتجانس العالمي من الصورة الأساسية. بعد ذلك، أثناء الاستقراء، يحتفظ محسن التفاصيل في مجال الأمواج (Wavelet-Domain Detail Enhancer) بالمكونات ذات التردد المنخفض من الصورة الأساسية للتأكد من التجانس الهيكلي، بينما يقوم بتوجيه المكونات ذات التردد العالي بشكل اختياري لتغنى بالتفاصيل الدقيقة والنسيج. تم إجراء تقييمات واسعة باستخدام Stable Diffusion XL أثبتت أن HiWave يخفف بشكل فعال من التشوهات المرئية الشائعة التي تظهر في الأساليب السابقة، مما يحقق جودة حسية أفضل. أكدت دراسة مستخدمين على أداء HiWave، حيث تم تفضيله على البديل الرائد في أكثر من 80% من المقارنات، مما يؤكد فعاليته في تكوين صور عالية الجودة وبدقائق فائقة دون الحاجة إلى إعادة التدريب أو تعديلات هيكلية.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.