HyperAIHyperAI

Command Palette

Search for a command to run...

تحرير صور تناسق الخلفية باستخدام KV-Edit

Date

منذ 8 أشهر

Size

792.11 MB

License

Apache 2.0

Paper URL

2502.17363

1. مقدمة البرنامج التعليمي

نجوم جيثب

مشروع KV-Edit، الذي أطلقته كلية الذكاء الاصطناعي بجامعة تسينغهوا في 25 فبراير 2025، هو أسلوب لتحرير الصور لا يتطلب تدريبًا، ويحافظ بدقة على تناسق الخلفية بين الصور الأصلية والمعدلة. يحقق المشروع أداءً مذهلاً في مهام التحرير المختلفة، بما في ذلك إضافة العناصر وإزالتها واستبدالها. يكمن جوهر KV-Edit في استخدام ذاكرة تخزين مؤقتة للقيم الرئيسية لتخزين أزواج القيم الرئيسية المصنفة حسب الخلفية. تُحفظ هذه الأزواج أثناء عملية عكس الصورة، وفي مرحلة إزالة التشويش، تُدمج مع محتوى المقدمة لإنشاء محتوى جديد متكامل بسلاسة مع الخلفية. يتجنب هذا النهج الآليات المعقدة أو متطلبات التدريب المكلفة، مع ضمان تناسق الخلفية وجودة الصورة بشكل عام. فيما يلي نتائج الأبحاث ذات الصلة: KV-Edit: تحرير الصور بدون تدريب للحفاظ على الخلفية بدقة .

مقدمة

يستخدم هذا البرنامج التعليمي الموارد لبطاقة واحدة A6000.

👉يوفر المشروع نموذجين من النماذج:

  • black-forest-labs/FLUX.1-dev:FLUX.1 [dev] هو محول تدفق مصحح بـ 12 مليار معلمة قادر على توليد صور من أوصاف نصية.
  • مختبرات الغابة السوداء/FLUX.1-سريع:FLUX.1 [schnell] هو محول تدفق مصحح يحتوي على 12 مليار معلمة قادر على توليد صور من أوصاف نصية.

أمثلة المشاريع

أمثلة المشاريع

2. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 1-2 دقيقة وتحديث الصفحة.

2. بعد الدخول إلى صفحة الويب، يمكنك بدء محادثة مع النموذج

خطوات:
1️⃣ قم برفع الصورة التي تريد تعديلها.
2️⃣ املأ كلمة الإشارة المصدر الخاصة بك وانقر على زر "عكس" لإجراء عكس الصورة.
3️⃣استخدم أداة الفرشاة للرسم فوق منطقة القناع.
4️⃣ املأ إشارة الهدف الخاصة بك واضبط المعلمات الفائقة.
5️⃣ انقر فوق الزر "تحرير" لتوليد صورتك المحررة.

❗️نصائح هامة للاستخدام:

  • لا يمكن للصور أن تتجاوز 100 كيلوبايت.
  • عند استخدام الإصدار المعتمد على العكس، فأنت تحتاج فقط إلى عكس كل صورة مرة واحدة، ومن ثم يمكنك تكرار الخطوات من 3 إلى 5 لمحاولات التحرير المتعددة!
  • re_init تعني إنشاء محتوى جديد باستخدام الصورة الممزوجة بالضوضاء بدلاً من النتيجة المعكوسة.
  • عندما يتم تحديد خيار attn_mask، يجب إدخال قناع قبل إجراء العكس.
  • عندما يكون القناع كبيرًا ويتم استخدام عدد أقل من خطوات التخطي أو إعادة التهيئة، فقد يكون محتوى المنطقة المقنعة غير متصل بالخلفية. يمكنك محاولة زيادة attn_scale.
  • العكس يعني العكس، والتحرير يعني التحرير لإزالة الخلفية.
  • يتحكم عدد خطوات التخطي في عدد خطوات التخطي.
  • معلمات توجيه الانعكاس.
  • إرشادات إزالة الضوضاء معلمات إرشادات تقليل الضوضاء.

التبادل والمناقشة

🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓

معلومات الاستشهاد

شكرًا لمستخدم Github com.zhangjunchang  لنشر هذا البرنامج التعليمي، معلومات مرجع المشروع هي كما يلي:

@article{zhu2025kv,
  title={KV-Edit: Training-Free Image Editing for Precise Background Preservation},
  author={Zhu, Tianrui and Zhang, Shiyi and Shao, Jiawei and Tang, Yansong},
  journal={arXiv preprint arXiv:2502.17363},
  year={2025}
}

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp