HyperAIHyperAI
منذ 14 أيام

شبكات GAN متعددة المهام واعية للإضاءة لفصل الخلفية والخلفية الأمامية

{Hubert P. H., Edmond S. L. Ho, Dimitrios Sakkos}
الملخص

تمتاز تقسيم الصورة إلى خلفية و أمامية بكونها مجالًا بحثيًا نشطًا على مر السنين. ومع ذلك، تفشل النماذج التقليدية في إنتاج نتائج دقيقة عند مواجهة مقاطع فيديو تتميز بظروف إضاءة صعبة. في هذه الورقة، نقدم نموذجًا قويًا يتيح استخلاص الصورة الأمامية بدقة حتى في المشاهد التي تكون شديدة الظلام أو السطوع، وفي حالات التغير المستمر للإضاءة ضمن تسلسل فيديو. يتم تحقيق ذلك من خلال شبكة توليدية متعددة المهام ثلاثية (TMT-GAN) التي تُنمذج بشكل فعّال العلاقة الدلالية بين الصور المظلمة والصورة المضيئة، وتنفذ التصنيف الثنائي بشكل مباشر من البداية إلى النهاية. تتمثل إسهاماتنا في جوانب متعددة: أولاً، نُظهر أنه من خلال تحسين خسارة الشبكة التوليدية (GAN) وخسارة التصنيف معًا، تتعلم الشبكة كلا المهمتين في آن واحد، حيث تُفيد كلتا المهمتين بعضهما البعض. ثانيًا، يُحسّن دمج ميزات الصور التي تختلف في مستويات الإضاءة داخل فرع التصنيف بشكل كبير من أداء الشبكة. وتشير التقييمات المقارنة على مجموعات بيانات معيارية حقيقية واصطناعية صعبة للغاية (ESI وSABS) إلى متانة نموذج TMT-GAN وتفوّقه على الأساليب المتطورة حاليًا.

شبكات GAN متعددة المهام واعية للإضاءة لفصل الخلفية والخلفية الأمامية | أحدث الأوراق البحثية | HyperAI