HyperAI

تحرير صور تناسق الخلفية باستخدام KV-Edit

1. مقدمة البرنامج التعليمي

نجوم جيثب

تم إطلاق مشروع KV-Edit من قبل كلية الذكاء الاصطناعي بجامعة تسينغهوا في 25 فبراير 2025. النموذج هو طريقة لتحرير الصور بدون تدريب يمكنها الحفاظ بدقة على اتساق الخلفية بين الصورة الأصلية والصورة المحررة، وقد حقق أداءً رائعًا في مهام التحرير المختلفة، بما في ذلك إضافة الكائنات وإزالتها واستبدالها. إن جوهر KV-Edit هو استخدام ذاكرة التخزين المؤقت KV لتخزين أزواج القيمة الرئيسية للعلامات الخلفية. أثناء عملية عكس الصورة، يتم الحفاظ على أزواج القيمة الرئيسية هذه، وأثناء مرحلة إزالة الضوضاء، يتم دمجها مع محتوى المقدمة لتوليد محتوى جديد يتكامل بسلاسة مع الخلفية. يتجنب هذا النهج الحاجة إلى آليات معقدة أو تدريب باهظ التكلفة، مع ضمان اتساق الخلفية وجودة الصورة بشكل عام. نتائج الورقة ذات الصلة هيKV-Edit: تحرير الصور بدون تدريب للحفاظ على الخلفية بدقة".

مقدمة

يستخدم هذا البرنامج التعليمي الموارد لبطاقة واحدة A6000.

👉يوفر المشروع نموذجين من النماذج:

  • black-forest-labs/FLUX.1-dev:FLUX.1 [dev] هو محول تدفق مصحح بـ 12 مليار معلمة قادر على توليد صور من أوصاف نصية.
  • مختبرات الغابة السوداء/FLUX.1-سريع:FLUX.1 [schnell] هو محول تدفق مصحح يحتوي على 12 مليار معلمة قادر على توليد صور من أوصاف نصية.

أمثلة المشاريع

أمثلة المشاريع

2. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 1-2 دقيقة وتحديث الصفحة.

2. بعد الدخول إلى صفحة الويب، يمكنك بدء محادثة مع النموذج

خطوات:
1️⃣ قم برفع الصورة التي تريد تعديلها.
2️⃣ املأ كلمة الإشارة المصدر الخاصة بك وانقر على زر "عكس" لإجراء عكس الصورة.
3️⃣استخدم أداة الفرشاة للرسم فوق منطقة القناع.
4️⃣ املأ إشارة الهدف الخاصة بك واضبط المعلمات الفائقة.
5️⃣ انقر فوق الزر "تحرير" لتوليد صورتك المحررة.

❗️نصائح هامة للاستخدام:

  • لا يمكن للصور أن تتجاوز 100 كيلوبايت.
  • عند استخدام الإصدار المعتمد على العكس، فأنت تحتاج فقط إلى عكس كل صورة مرة واحدة، ومن ثم يمكنك تكرار الخطوات من 3 إلى 5 لمحاولات التحرير المتعددة!
  • re_init تعني إنشاء محتوى جديد باستخدام الصورة الممزوجة بالضوضاء بدلاً من النتيجة المعكوسة.
  • عندما يتم تحديد خيار attn_mask، يجب إدخال قناع قبل إجراء العكس.
  • عندما يكون القناع كبيرًا ويتم استخدام عدد أقل من خطوات التخطي أو إعادة التهيئة، فقد يكون محتوى المنطقة المقنعة غير متصل بالخلفية. يمكنك محاولة زيادة attn_scale.
  • العكس يعني العكس، والتحرير يعني التحرير لإزالة الخلفية.
  • يتحكم عدد خطوات التخطي في عدد خطوات التخطي.
  • معلمات توجيه الانعكاس.
  • إرشادات إزالة الضوضاء معلمات إرشادات تقليل الضوضاء.

التبادل والمناقشة

🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓

معلومات الاستشهاد

شكرًا لمستخدم Github com.zhangjunchang  لنشر هذا البرنامج التعليمي، معلومات مرجع المشروع هي كما يلي:

@article{zhu2025kv,
  title={KV-Edit: Training-Free Image Editing for Precise Background Preservation},
  author={Zhu, Tianrui and Zhang, Shiyi and Shao, Jiawei and Tang, Yansong},
  journal={arXiv preprint arXiv:2502.17363},
  year={2025}
}