LaCon: التوسع المتأخر للقيود لتصنيع الصور القابلة للتوجيه

أثبتت نماذج الانتشار قدرات مثيرة للإعجاب في توليد صور واقعية ومبتكرة. لتقديم المزيد من القابلية للتحكم في عملية التوليد، استخدمت الدراسات الحالية، والتي تُسمى في هذا البحث بالطرق المبكرة للقيود (early-constraint methods)، شروطًا إضافية وأدمجتها في النماذج المُدربة مسبقًا للانتشار. بشكل خاص، اعتمدت بعض هذه الدراسات على وحدات محددة بحسب الشرط لمعالجة الشروط بشكل منفصل، حيث يواجهون صعوبة في التعميم عبر شروط أخرى. رغم أن الدراسات اللاحقة قد قدمت حلولًا موحدة لحل مشكلة التعميم، فإنها أيضًا تتطلب موارد إضافية للتنفيذ، مثل مدخلات إضافية أو تحسين المعلمات، حيث يتوقع أن تكون الحلول الأكثر مرونة وكفاءة قادرة على أداء التركيب المرشد للصورة بشكل قابل للتوجيه. في هذا البحث، نقدم نموذجًا بديلًا يُعرف باسم نموذج الانتشار المتأخر للقيود (Late-Constraint Diffusion - LaCon) لتضمين الشروط المختلفة بشكل متزامن في النماذج المُدربة مسبقًا للانتشار. تحديدًا، يقوم LaCon بإنشاء تناسق بين الشرط الخارجي والميزات الداخلية لنماذج الانتشار، ويستخدم هذا التناسق لدمج الشرط المستهدف، مما يوجه عملية العينة لإنتاج نتائج مقاسة حسب المقاس. توضح النتائج التجريبية على مجموعة بيانات COCO فعالية LaCon وقدرته الفائقة على التعميم تحت مختلف الشروط والإعدادات. تقوم دراسات الإبطال بفحص وظائف المكونات المختلفة في LaCon وتوضيح إمكاناته الكبيرة كحل فعال لتقديم قابلية تحكم مرنة لنماذج الانتشار.