HyperAIHyperAI

Command Palette

Search for a command to run...

InstanceDiffusion: التحكم على مستوى المثيلات في توليد الصور

Jinlong Zhang Xiaowei Guo Chongxuan Li Yongxin Tu Zhiyuan Liu

الملخص

تُنتِج نماذج التوسيع من النص إلى الصورة صورًا ذات جودة عالية ولكنها لا تقدم السيطرة على الحالات الفردية في الصورة. نقدم InstanceDiffusion (توسيع الحالة) الذي يضيف سيطرة دقيقة على مستوى الحالة إلى نماذج التوسيع من النص إلى الصورة. يدعم InstanceDiffusion شروط لغوية حرة لكل حالة ويوفر طرقًا مرنة لتحديد مواقع الحالات مثل نقاط بسيطة، رسومات بالقلم، مربعات الحدود أو أقنعة تقسيم الحالات المعقدة، بالإضافة إلى مجموعاتها. نقترح ثلاثة تغييرات رئيسية على نماذج النص إلى الصورة التي تمكن من السيطرة الدقيقة على مستوى الحالة. يمكّن كتلة UniFusion (الاندماج الموحد) لدينا الشروط على مستوى الحالة لنماذج النص إلى الصورة، بينما يحسن كتلة ScaleU (توسيع المقياس) دقة الصورة، ويحسّن مُؤَسِّسُنا للحالات المتعددة Multi-instance Sampler (مؤثر الحالات المتعددة) الإنتاج للحالات المتعددة. يتفوق InstanceDiffusion بشكل كبير على النماذج المتخصصة الأكثر تقدمًا لكل شرط موقع. وبشكل لافت للنظر، على مجموعة بيانات COCO، نتفوق على أفضل ما سبق بنسبة 20.4% في AP50box_{50}^\text{box}50box للمدخلات المربعة، وبنسبة 25.4% في IoU للأقنعة.请注意,阿拉伯语中的术语 "UniFusion" 和 "ScaleU" 被翻译为 "الاندماج الموحد" 和 "توسيع المقياس" 分别,但这些术语在括号中也保留了英文原名以确保信息的完整性。同时,COCO 数据集和 AP50box_{50}^\text{box}50box、IoU 等指标也被直接引用并解释。


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp