HyperAIHyperAI
منذ 17 أيام

التفريغ للماستينغ الطبيعي للصور الإنشائية

Yihan Hu, Yiheng Lin, Wei Wang, Yao Zhao, Yunchao Wei, Humphrey Shi
التفريغ للماستينغ الطبيعي للصور الإنشائية
الملخص

نهدف إلى الاستفادة من نموذج التشتت (diffusion) لمعالجة مهمة تقطيع الصور (image matting) الصعبة. ومع ذلك، فإن الحواجز الكبيرة التي تفرضها التكلفة الحسابية العالية وانعدام التماثل في عينات الضوضاء بين عمليتي التدريب والاستنتاج تُشكل عقبات جوهرية أمام تحقيق هذا الهدف. في هذا البحث، نقدم نموذج DiffMatte، وهو حل مصمم لتجاوز هذه التحديات بشكل فعّال. أولاً، يُفكّك DiffMatte المُفكّك (decoder) من التصميم المتشابك بشكل معقد في الشبكات المستخدمة في تقطيع الصور، بحيث يحتوي فقط على مُفكّك خفيف الوزن واحد خلال دورات عملية التشتت. وباستخدام هذه الاستراتيجية، يتم تقليل النمو في التكلفة الحسابية مع زيادة عدد العينات. ثانيًا، نستخدم استراتيجية تدريب مُتماشية ذات فترات زمنية متساوية، مما يضمن تمايزًا ثابتًا في عينات الضوضاء بين التدريب والاستنتاج عبر المجال الزمني بأكمله. تم تصميم DiffMatte بمراعاة المرونة، مما يسمح بدمجه بسلاسة في مختلف هياكل تقطيع الصور الحديثة. تُظهر النتائج التجريبية الواسعة أن DiffMatte لا يحقق مستوى متقدم جدًا على مجموعة اختبار Composition-1k، بل يتفوق على أفضل الطرق السابقة بنسبة 5% و15% على التوالي في معياري SAD وMSE، كما يُظهر قدرة تعميم أقوى في مجموعات اختبار أخرى.

التفريغ للماستينغ الطبيعي للصور الإنشائية | أحدث الأوراق البحثية | HyperAI