HyperAIHyperAI

Command Palette

Search for a command to run...

Paints-Undo عرض توضيحي للعملية الكاملة لإنشاء لوحة من صورة واحدة

مقدمة البرنامج التعليمي

يعد هذا البرنامج التعليمي عرضًا توضيحيًا لتشغيل PaintsUndo بنقرة واحدة. تم تثبيت البيئة والتبعيات ذات الصلة. يمكنك تجربته عن طريق استنساخه وبدء تشغيله بنقرة واحدة.

PaintsUndo هو نموذج أساسي يمكنه محاكاة سلوك الرسم البشري. ويهدف إلى توفير نموذج أساسي لسلوك الرسم لدى البشر. وفي الوقت نفسه، من المأمول أن تتمكن نماذج الذكاء الاصطناعي المستقبلية من تلبية الاحتياجات الحقيقية للفنانين البشريين بشكل أفضل. يوفر هذا المشروع سلسلة من النماذج التي تأخذ صورة كمدخل وتخرج سلسلة من الرسومات لتلك الصورة. يحاكي النموذج السلوك البشري أثناء عملية الرسم، بما في ذلك على سبيل المثال لا الحصر التخطيط، والتلوين، والتظليل، والتحويل، والانعكاس إلى اليسار واليمين، وضبط منحنيات الألوان، وتغيير رؤية الطبقة، وحتى تغيير الفكرة العامة أثناء عملية الرسم. تم استلهام اسم "Paints-Undo" من التشابه في أن إخراج النموذج يبدو مثل الضغط على زر "Undo" (عادةً Ctrl + Z) عدة مرات في برنامج الرسم بالذكاء الاصطناعي.

يصدر المشروع حاليًا نموذجين: نموذج إطار واحد ونموذج إطارات متعددة.

  • دهانات_تراجع_إطار_واحد
  • تراجع عن الطلاء متعدد الإطارات

يأخذ نموذج الإطار الفردي صورة كمدخل ويخرج صورة.

  • افترض أن العمل الفني يمكن إنشاؤه دائمًا عن طريق الرسم يدويًا 1000 مرة، وأن ترتيب الرسومات هو عدد صحيح من 0 إلى 999. الترتيب الذي يمثله 0 هو العمل الفني المكتمل النهائي، و999 هو أول ضربة فرشاة مرسومة على القماش الأبيض النقي. يمكن اعتبار هذا النموذج بمثابة نموذج "التراجع" (أو Ctrl+Z).
  • أدخل الصورة النهائية وحدد عدد المرات التي تريد الضغط فيها على "Ctrl+Z". بعد الضغط على "Ctrl+Z"، سوف يقوم النموذج بإنشاء عدد مماثل من لقطات الشاشة لعملية الرسم. إذا كان عدد المرات المحددة هو 100، فهذا يعني أنك تريد محاكاة "Ctrl+Z" 100 مرة على هذه الصورة للحصول على لقطة شاشة بعد 100 مرة من "Ctrl+Z".

يأخذ النموذج متعدد الإطارات صورتين كمدخلات ويخرج 16 إطارًا وسيطًا بين صورتي المدخلات.

  • وبالمقارنة مع نموذج الإطار الواحد، فإن الفرق بين الصورتين أصغر، ولكن السرعة أيضًا أبطأ كثيرًا وأقل عشوائية.
  • يقتصر إنشاء الصورة على 16 إطارًا.

في طرق البناء لهذا المشروع، الطريقة الافتراضية هي استخدامها معًا. أولاً، استخدم نموذج الإطار الفردي لاستنتاج ما يقرب من 5 إلى 7 مرات للحصول على 5 إلى 7 "إطارات رئيسية"، ثم استخدم نموذج الإطارات المتعددة "لاستيفاء" هذه الإطارات الرئيسية لتوليد مقطع فيديو طويل نسبيًا. في النهاية، يمكنك عادةً الحصول على حوالي 100 صورة وسيطة.

من الناحية النظرية، يمكن استخدام النظام بطرق متنوعة، حتى لتوفير مقاطع فيديو طويلة إلى ما لا نهاية، ولكن من الناحية العملية يعمل النظام حاليًا بشكل أفضل عندما يكون عدد الإطارات النهائي حوالي 100-500.

يستخدم هذا البرنامج التعليمي بطاقة RTX 5090 واحدة كمورد.

عرض التأثير

طريقة التشغيل (تستغرق حوالي 10 ثوانٍ للتهيئة بعد بدء تشغيل الحاوية، ثم تنفيذ العمليات التالية)

1. بعد استنساخ الحاوية وبدء تشغيلها، انسخ واجهة برمجة التطبيقات إلى متصفحك

2. خطوات الاستخدام

إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 2-3 دقائق وتحديث الصفحة.

إخراج نموذج الإطار الفردي

إجمالي مخرجات النموذج

وصف المعلمة

  • "خطوات التشغيل": يمكنك تحديد ترتيب الإطارات الرئيسية التي سيتم إخراجها. كلما كان الترتيب الذي تحدده أكبر، كلما كانت الصورة المولدة أكثر تشابهًا مع الصورة الأصلية.
  • 「المرحلة 1 من البذرة」: يمكنك تحديد بذرة عشوائيًا لتوليد الإطار الرئيسي.
  • "الخطوات": يمكنك تحديد عدد الخطوات التي ينفذها النموذج لكل إطار.
  • 「مقياس CFG」: يمكنك التحكم في عشوائية الصورة التي تم إنشاؤها. كلما كانت القيمة أصغر، كلما زادت عشوائية الصورة المولدة.
  • 「الموجه السلبي」: املأ الكلمات السلبية للتخفيف من الموقف حيث تحتوي الصور المولدة على هذه الكلمات السلبية.

إنشاء فيديو

وصف المعلمة

  • 「المطالبات」: املأ المطالبات الإيجابية لتحسين جودة ومحتوى الصور التي تم إنشاؤها.
  • 「المرحلة 2 من البذور」: يمكنك تحديد البذور بشكل عشوائي لتوليد الصورة.
  • 「مقياس CFG」: يمكنك التحكم في عشوائية الصورة التي تم إنشاؤها. كلما كانت القيمة أصغر، كلما زادت عشوائية الصورة المولدة.
  • "خطوات أخذ العينات": يمكنك تغيير عدد تكرارات أخذ العينات. كلما كانت القيمة أكبر، كلما كانت الصورة المولدة أكثر دقة.
  • "FPS": يمكنك تغيير معدل الإطارات للفيديو الذي تم إنشاؤه. الإعداد الافتراضي هو 4 إطارات، مما يعني أن الفيديو يحتوي على أربع صور تم إنشاؤها في الثانية.

معلومات الاستشهاد

معلومات الاستشهاد لهذا المشروع هي كما يلي:

@Misc{paintsundo,
  author = {Paints-Undo Team},
  title  = {Paints-Undo GitHub Page},
  year   = {2024},
}
@article{paintsalter,
    author = {Zhang, Lvmin and Yan, Chuan and Guo, Yuwei and Xing, Jinbo and Agrawala, Maneesh},
    title = {Generating Past and Future in Digital Painting Processes},
    journal = {ACM Transactions on Graphics (SIGGRAPH 2025)},
    year = {2025},
    volume = {44},
    number = {4},
    articleno = {127},
    numpages = {13},
}

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
Paints-Undo عرض توضيحي للعملية الكاملة لإنشاء لوحة من صورة واحدة | الدروس | HyperAI