العكس السالب للحث: عكس الصور بسرعة للتحرير باستخدام نماذج التفتيت الموجهة بالنص

في تحرير الصور باستخدام نماذج التفتيت (diffusion models)، من الضروري الحفاظ على دقة إعادة بناء الصورة الأصلية مع تغيير أسلوبها. رغم أن الأساليب الحالية تضمن دقة إعادة البناء من خلال التحسين، إلا أن عيبًا منها هو الوقت الكبير المطلوب للتحسين. في هذا البحث، نقترح طريقة الانعكاس بالحث السلبي (negative-prompt inversion)، وهي قادرة على تحقيق إعادة بناء مكافئة فقط من خلال الانتشار الأمامي دون الحاجة إلى التحسين، مما يمكّن من عمليات تحرير فائقة السرعة. لقد أثبتنا تجريبيًا أن دقة إعادة البناء لطريقتنا مقاربة لتلك الموجودة في الأساليب الحالية، مما يسمح بإعادة بناء الصور بدقة 512 بكسل وفي 50 خطوة取样 في حوالي 5 ثوانٍ، وهو أسرع بمرتين أكثر من 30 مرة من الانعكاس النصي الفارغ (null-text inversion). خفض وقت الحساب بواسطة الطريقة المقترحة يسمح لنا أيضًا باستخدام عدد أكبر من خطوات العينة في نماذج التفتيت لتحسين دقة إعادة البناء مع زيادة معتدلة في وقت الحساب.注:在最后一句中,“取样”一词在阿拉伯语中应为“عينة”或“خطوات العينة”。因此,我将对这一部分进行修正,以确保用词准确。修正后的翻译:في تحرير الصور باستخدام نماذج التفتيت (diffusion models)، من الضروري الحفاظ على دقة إعادة بناء الصورة الأصلية مع تغيير أسلوبها. رغم أن الأساليب الحالية تضمن دقة إعادة البناء من خلال التحسين، إلا أن عيبًا منها هو الوقت الكبير المطلوب للتحسين. في هذا البحث، نقترح طريقة الانعكاس بالحث السلبي (negative-prompt inversion)، وهي قادرة على تحقيق إعادة بناء مكافئة فقط من خلال الانتشار الأمامي دون الحاجة إلى التحسين، مما يمكّن من عمليات تحرير فائقة السرعة. لقد أثبتنا تجريبيًا أن دقة إعادة البناء لطريقتنا مقاربة لتلك الموجودة في الأساليب الحالية، مما يسمح بإعادة بناء الصور بدقة 512 بكسل وفي 50 خطوة عينة ضمن حوالي 5 ثوانٍ، وهو أسرع بمرتين أكثر من 30 مرة من الانعكاس النصي الفارغ (null-text inversion). خفض وقت الحساب بواسطة الطريقة المقترحة يسمح لنا أيضًا باستخدام عدد أكبر من خطوات العينة في نماذج التفتيت لتحسين دقة إعادة البناء مع زيادة معتدلة في وقت الحساب.