HyperAIHyperAI

Command Palette

Search for a command to run...

DreamBooth: ضبط نموذج التفتيت النصي إلى الصور بدقة لتقديم توليد موجه بالموضوع

Nataniel Ruiz Yuzheng Li Varun Jampani Yael Pritch Michael Rubinstein Kfir Aberman

الملخص

حققت نماذج النص إلى الصورة الكبيرة قفزة ملحوظة في تطور الذكاء الاصطناعي، مما مكّن من إنتاج صور عالية الجودة ومتنوعة من دعوة نصية معينة. ومع ذلك، فإن هذه النماذج تعاني من عدم القدرة على تقليد مظهر الأجسام في مجموعة مرجعية معينة وإنتاج صور جديدة لها في سياقات مختلفة. في هذا البحث، نقدم طريقة جديدة لـ "الشخصنة" (personalization) لنماذج التوسع من النص إلى الصورة. عند تقديم بضعة صور فقط للجسم كمدخلات، نقوم بضبط نموذج النص إلى الصورة المدرب مسبقًا بحيث يتعلم ربط معرف فريد بذلك الجسم المحدد. بمجرد أن يتم تضمين الجسم في مجال الإخراج للنموذج، يمكن استخدام المعرف الفريد لإنتاج صور واقعية جديدة للجسم في سياقات مشاهد مختلفة.من خلال الاستفادة من الأولوية الدلالية المدمجة في النموذج مع خسارة الحفاظ على الأولوية الخاصة بالفئة ذات الأصل الذاتي الجديدة (autogenous class-specific prior preservation loss)، تمكن تقنيتنا من إنتاج الجسم في مشاهد وأوضاع وزوايا رؤية وظروف إضاءة متنوعة لا تظهر في الصور المرجعية. نطبق تقنيتنا على عدة مهمات كانت تعتبر سابقًا غير قابلة للحل، بما في ذلك إعادة سياق الجسم، وإنتاج الرؤية المنظمة بالنص، والرسم الفني، مع الحفاظ على الخصائص الرئيسية للجسم. كما نوفر مجموعة بيانات جديدة وبروتوكول تقييم لهذا المهمة الجديدة التي تعتمد على إنتاج الجسم. صفحة المشروع: https://dreambooth.github.io/


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp