نموذج تحفيزي للانتشار لتنقية الصور عبر التضمين التكيفي والتجميع

تنقية الصور هي مشكلة أساسية في التصوير الحاسوبي، حيث يعتبر تحقيق مستوى عالٍ من الإدراك مع تشويه منخفض أمرًا مطلوبًا بشدة. تواجه الطرق الحالية إما صعوبة في جودة الإدراك أو تعاني من تشويه كبير. مؤخرًا، حققت نماذج الانتشار (diffusion model) أداءً رائدًا في مهام مختلفة وأظهرت إمكانات كبيرة لتنقية الصور. ومع ذلك، فإن تحفيز نماذج الانتشار لتنقية الصور ليس أمرًا بسيطًا ويحتاج إلى حل العديد من المشاكل الحرجة. من ناحية، يعيق عدم اتساق المدخلات الربط بين نماذج الانتشار وتنقية الصور. ومن ناحية أخرى، يؤدي عدم اتساق المحتوى بين الصورة المنتجة والصورة المرغوب تنقيتها إلى التشويه. لحل هذه المشاكل، نقدم استراتيجية جديدة تُعرف باسم "نموذج الانتشار لتنقية الصور" (DMID) من خلال فهم وإعادة النظر في نموذج الانتشار من وجهة نظر التنقية. تتضمن استراتيجيتنا DMID طريقة غرز تكيفي تقوم بغرس الصورة الضوضائية في نموذج انتشار غير مشروط مُدرب مسبقًا وطريقة تجميع تكيفي تقلل من التشويه في الصورة المنقاة. تحقق استراتيجيتنا DMID أداءً رائدًا على كل من المقاييس القائمة على التشويه والمقاييس القائمة على الإدراك، سواء بالنسبة للضوضاء الغاوسية أو الضوضاء الواقعية في تنقية الصور. يمكن الحصول على الكود البرمجي من الرابط: https://github.com/Li-Tong-621/DMID.