HyperAI

برنامج ComfyUI LanPaint التعليمي لاستعادة الصور

1. مقدمة البرنامج التعليمي

LanPaint هي أداة إصلاح صور محلية مفتوحة المصدر تم إصدارها في مارس 2025. وهي تستخدم طريقة استنتاج مبتكرة لتكييف مجموعة متنوعة من نماذج الانتشار المستقرة (بما في ذلك النماذج المخصصة) دون تدريب إضافي، وبالتالي تحقيق استعادة عالية الجودة للصور. بالمقارنة مع الطرق التقليدية، يوفر LanPaint حلاً أخف وزنًا يقلل بشكل كبير من متطلبات بيانات التدريب وموارد الحوسبة. نتائج الورقة ذات الصلة هيLanpaint: رسم داخلي انتشاري بدون تدريب مع استدلال شرطي دقيق وسريع".

يستخدم هذا البرنامج التعليمي الموارد لبطاقة RTX 4090 واحدة.

يوفر هذا المشروع 8 نماذج سير عمل، باستخدام ملفات النموذج التالية في المجموع:

  • animagineXL40_v40pt.safetensors
  • fux1-dev-fp8.safetensors
  • juggernautXL_juggXlByRundiffusion.safetensors
  • clip_l_hidream.safetensors
  • clip_g_hidream.safetensors
  • تدفقات الأمان
  • hidream-i1-full-Q6_K.gguf
  • t5-v1_1-xxl-encoder-Q4_K_S.gguf
  • ميتا-لاما-3.1-8B-Instruct-Q4_K_M.gguf

2. أمثلة المشاريع

تستخدم جميع الأمثلة بذرة عشوائية 0 لتوليد دفعات مكونة من 4 صور للسماح بالمقارنة العادلة.

مثال HiDream: InPaint (LanPaint K Sampler، 5 خطوات للتفكير)

اتساق الأحرف (إنشاء عرض جانبي) (LanPaint K Sampler، 5 خطوات تفكير)

نموذج التدفق في برنامج الرسام (LanPaint K Sampler، 5 خطوات للتفكير)

3. قائمة الوظائف

  • 🎨إصلاح التدريب صفر:يعمل مباشرة مع أي طراز SD (مع أو بدون ControlNet) وطراز Flux! حتى النماذج المخصصة التي قمت بتدريبها بنفسك.
  • 🛠️التكامل البسيط: نفس سير العمل مثل ComfyUI KSampler القياسي.
  • 🎯  جيل فارغ حقيقي:لا حاجة لتعيين إزالة الضوضاء الافتراضية إلى 0.7 المستخدمة في الطرق التقليدية (الحفاظ على 30% بكسل الأصلية في القناع): 100% يتم إنشاء محتوى جديد دون الكتابة فوق المحتوى الموجود.
  • 🌈  أكثر من مجرد طلاء:يمكنك أيضًا استخدام هذا كطريقة سهلة لإنشاء أحرف متسقة.

4. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 1-2 دقيقة وتحديث الصفحة.

2. العرض التوضيحي الوظيفي

كيفية الاستخدام

1. 导入工作流  

يحتوي هذا المشروع على 8 نماذج سير عمل مدمجة.
عنوان تنزيل سير العمل:تنزيل نموذج سير العمل

2. 本教程 Demo 已将工作流搭建好,仅需修改「CLIP Text Encode(Prompt)」,
并分别在「Original Image」和「Mask Image for inpainting」节点处上传对应的图片,
即可点击「run」来运行。

الخطوات التالية تأخذ المثال رقم 6 كمثال. بالنسبة للاستنساخ الأول، يتعين عليك فتح سير العمل يدويًا في المجلد لتحميله. افتح InPainted_Drag_Me_to_ComfyUI.png في ComfyUI وقم بتحميل سير العمل. 

3. 将 Original_No_Mask.png 上传到 Load image 组(最左侧)中的 Original Image 节点(左一)。

4. 将 Masked_Load_Me_in_Loader.png 上传到 Mask image for inpainting 组中的 Load image 节点(左二)。
5. 本教程已添加了 8 个样例工作流所需的模型文件并且每个工作流会自行选择模型,您可以跳过此步骤,执行下一步(注意:若使用非样例工作流,请根据需求自行选择或下载模型)。
6. 设置基本采样器的参数,项目已设置好默认参数,若您无需修改参数,可以跳过此步骤,执行下一步。
LanPaint KSampler

واجهة مبسطة، يوصى بالإعدادات الافتراضية:

  • الخطوات: يوصى بـ 50+.
  • LanPaint NumSteps: عدد المرات التي يجب التفكير فيها قبل إزالة الضوضاء. يوصى باستخدام الإصدار 5 لمعظم المهام.
  • LanPaint EndSigma: عندما ينخفض مستوى الضوضاء إلى ما دون هذا المستوى، سيتم تعطيل التفكير. الإعداد الموصى به هو 0.6 لأسلوب الواقع (تم اختباره على Juggernaut-xl) و3.0 لأسلوب الأنمي (تم اختباره على Animagine XL 4.0).

LanPaint KSampler (متقدم)

المعلمةنِطَاقيصف
Steps0-100العدد الإجمالي لخطوات أخذ العينات الانتشارية. كلما زاد عدد الخطوات، كلما كان تأثير الإصلاح أفضل. الإعداد الموصى به هو 50.
LanPaint_NumSteps0-20عدد تكرارات الاستدلال ("عمق التفكير") لكل خطوة من خطوات إزالة الضوضاء. المهام البسيطة: 1-2. مهام الصعوبة: 5-10
LanPaint_Lambda0.1-50قوة محاذاة المحتوى (كلما زادت كانت أكثر صرامة). موصى به 8.0
LanPaint_StepSize0.1-1.0حجم الخطوة الموصى به لكل خطوة تفكير هو 0.5.
LanPaint_EndSigma0.0-20.0مستوى الضوضاء الذي يصبح التفكير عند انخفاضه معطلاً. القيمة الموصى بها هي 0.3 – 3. القيم الأعلى تكون أسرع، ولكنها قد تؤثر على الجودة. إن القيم المنخفضة تعطي تفكيرًا أكثر قوة ولكنها قد تؤدي إلى تشويش الناتج.
LanPaint_cfg_BIG-20-20نسبة CFG التي يجب استخدامها عند محاذاة المناطق المقنعة وغير المقنعة (تميل القيم الإيجابية إلى تجاهل الإشارات، بينما تعمل القيم السلبية على تعزيز الإشارات). عندما لا تكون الإشارة مهمة، يوصى باستخدام 8 للترميم السلس (على سبيل المثال، الأطراف والوجه). عندما تكون الإشارات مهمة، مثل اتساق الأحرف (أي وجهات نظر متعددة)، يوصى باستخدام -0.5
7. 点击「Run」按钮,生成结果图像
8. 您将通过 3 种方法获得最终的图像

5. المناقشة

🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓ 

معلومات الاستشهاد

معلومات الاستشهاد لهذا المشروع هي كما يلي:

@misc{zheng2025lanpainttrainingfreediffusioninpainting,
      title={Lanpaint: Training-Free Diffusion Inpainting with Exact and Fast Conditional Inference}, 
      author={Candi Zheng and Yuan Lan and Yang Wang},
      year={2025},
      eprint={2502.03491},
      archivePrefix={arXiv},
      primaryClass={eess.IV},
      url={https://arxiv.org/abs/2502.03491}, 
}