تحسين التظليل الصوتي العميق من خلال افتراض السلسية المحلية

التركيب الطبيعي للصور هو مهمة أساسية وصعبة في رؤية الحاسوب. بشكل تقليدي، يُصاغ هذا المشكل كمشكلة غير محددة بشكل كافٍ. وبما أن المشكلة غير محددة بشكل جيد، فإنه يتطلب افتراضات إضافية حول توزيع البيانات لجعل المشكلة محددة بشكل جيد. في الطرق الكلاسيكية للتركيب، يُعتمد افتراض شائع هو افتراض السلسة المحلية بالنسبة للألوان الخاصة بالخلفية والكائن الأمامي. ومع ذلك، لم تُنظر إلى استخدام هذه الافتراضات بشكل منهجي في الطرق القائمة على التعلم العميق للتركيب. في هذا العمل، ننظر إلى اثنين من افتراضات السلسة المحلية التي يمكن أن تساعد في تحسين نماذج التركيب الصوتي العميق. استنادًا إلى هذه الافتراضات، نقترح ثلاث تقنيات، وهي: تحسين مجموعة التدريب، وتعزيز الألوان، وتحسين التغذية العكسية، والتي يمكن أن تُحسّن أداء نموذج التركيب الصوتي العميق بشكل ملحوظ. قمنا بإجراء تجارب لتقييم فعالية الخوارزمية المقترحة. وأظهرت النتائج التجريبية أن الطريقة المقترحة تتمتع بأداء متميز مقارنة بالطرق الحالية للتركيب.