HyperAIHyperAI

Command Palette

Search for a command to run...

التفريغ للماستينغ الطبيعي للصور الإنشائية

Yihan Hu Yiheng Lin Wei Wang Yao Zhao Yunchao Wei Humphrey Shi

الملخص

نهدف إلى الاستفادة من نموذج التشتت (diffusion) لمعالجة مهمة تقطيع الصور (image matting) الصعبة. ومع ذلك، فإن الحواجز الكبيرة التي تفرضها التكلفة الحسابية العالية وانعدام التماثل في عينات الضوضاء بين عمليتي التدريب والاستنتاج تُشكل عقبات جوهرية أمام تحقيق هذا الهدف. في هذا البحث، نقدم نموذج DiffMatte، وهو حل مصمم لتجاوز هذه التحديات بشكل فعّال. أولاً، يُفكّك DiffMatte المُفكّك (decoder) من التصميم المتشابك بشكل معقد في الشبكات المستخدمة في تقطيع الصور، بحيث يحتوي فقط على مُفكّك خفيف الوزن واحد خلال دورات عملية التشتت. وباستخدام هذه الاستراتيجية، يتم تقليل النمو في التكلفة الحسابية مع زيادة عدد العينات. ثانيًا، نستخدم استراتيجية تدريب مُتماشية ذات فترات زمنية متساوية، مما يضمن تمايزًا ثابتًا في عينات الضوضاء بين التدريب والاستنتاج عبر المجال الزمني بأكمله. تم تصميم DiffMatte بمراعاة المرونة، مما يسمح بدمجه بسلاسة في مختلف هياكل تقطيع الصور الحديثة. تُظهر النتائج التجريبية الواسعة أن DiffMatte لا يحقق مستوى متقدم جدًا على مجموعة اختبار Composition-1k، بل يتفوق على أفضل الطرق السابقة بنسبة 5% و15% على التوالي في معياري SAD وMSE، كما يُظهر قدرة تعميم أقوى في مجموعات اختبار أخرى.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp