منذ 8 أشهر

الملخص

تتفوق نماذج الانتشار في توليد الصور من النص، خاصةً في توليد الصور الشخصية القائمة على الموضوع. ومع ذلك، فإن الأساليب الحالية غير فعالة بسبب التحسين الدقيق المحدد للموضوع، والذي يتطلب حسابات مكثفة ويعرقل الانتشار الفعال. بالإضافة إلى ذلك، تواجه الأساليب الحالية صعوبات في توليد الصور متعددة المواضيع حيث أنها غالباً ما تدمج الخصائص بين المواضيع. نقدم FastComposer (فاستكومبوسر) الذي يمكّن من توليد الصور متعددة المواضيع الشخصية بكفاءة دون الحاجة إلى التحسين الدقيق. يستخدم FastComposer متجهات الموضوع المستخرجة بواسطة كودر الصور لتقوية التحكم النصي العام في نماذج الانتشار، مما يسمح بتوليد صور شخصية بناءً على صور الموضوع والتعليمات النصية باستخدام عمليات الإرسال فقط. لحل مشكلة دمج الهوية في توليد الصور متعددة المواضيع، يقترح FastComposer إشراف تحديد الموقع عبر الانتباه خلال التدريب، مما يفرض تركيز انتباه المواضيع المرجعية على المناطق الصحيحة في الصور المستهدفة. يؤدي التعامل مع متجهات الموضوع بطريقة بسيطة إلى الانسياق الزائد نحو الموضوع. يقترح FastComposer تعديلًا متأخرًا لمتجهات الموضوع خلال خطوة إزالة الضوضاء للحفاظ على الهوية والقابلية للتحرير في توليد الصور القائم على الموضوع. يقوم FastComposer بتوليد صور لأفراد عديدين غير معروفين بمختلف الأنماط والأفعال والسياقات. ويحقق سرعة أكبر بمقدار 300-2500 مرة مقارنة بالأساليب القائمة على التحسين الدقيق ولا يحتاج إلى أي تخزين إضافي للمواضيع الجديدة. يعد FastComposer خطوة مهمة نحو توليد صور عالية الجودة وشخصية وكفوءة لمواضيع متعددة. يمكن الحصول على الكود والنموذج ومجموعة البيانات من الرابط التالي: https://github.com/mit-han-lab/fastcomposer.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Xiao Guangxuan ; Yin Tianwei ; Freeman William T. ; Durand Frédo ; Han Song

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Xiao Guangxuan ; Yin Tianwei ; Freeman William T. ; Durand Frédo ; Han Song

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Xiao Guangxuan ; Yin Tianwei ; Freeman William T. ; Durand Frédo ; Han Song

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

FastComposer: توليد صور متعددة المواضيع بدون ضبط مع التركيز الموضعي

Xiao Guangxuan ; Yin Tianwei ; Freeman William T. ; Durand Fr&#xe9;do ; Han Song

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

FastComposer: توليد صور متعددة المواضيع بدون ضبط مع التركيز الموضعي

Xiao Guangxuan ; Yin Tianwei ; Freeman William T. ; Durand Fr&#xe9;do ; Han Song

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

FastComposer: توليد صور متعددة المواضيع بدون ضبط مع التركيز الموضعي

Xiao Guangxuan ; Yin Tianwei ; Freeman William T. ; Durand Fr&#xe9;do ; Han Song

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Xiao Guangxuan ; Yin Tianwei ; Freeman William T. ; Durand Frédo ; Han Song

Xiao Guangxuan ; Yin Tianwei ; Freeman William T. ; Durand Frédo ; Han Song

Xiao Guangxuan ; Yin Tianwei ; Freeman William T. ; Durand Frédo ; Han Song