HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 4 أشهر

شبكات GAN متعددة المهام واعية للإضاءة لفصل الخلفية والخلفية الأمامية

{Hubert P. H. Edmond S. L. Ho Dimitrios Sakkos}

الملخص

تمتاز تقسيم الصورة إلى خلفية و أمامية بكونها مجالًا بحثيًا نشطًا على مر السنين. ومع ذلك، تفشل النماذج التقليدية في إنتاج نتائج دقيقة عند مواجهة مقاطع فيديو تتميز بظروف إضاءة صعبة. في هذه الورقة، نقدم نموذجًا قويًا يتيح استخلاص الصورة الأمامية بدقة حتى في المشاهد التي تكون شديدة الظلام أو السطوع، وفي حالات التغير المستمر للإضاءة ضمن تسلسل فيديو. يتم تحقيق ذلك من خلال شبكة توليدية متعددة المهام ثلاثية (TMT-GAN) التي تُنمذج بشكل فعّال العلاقة الدلالية بين الصور المظلمة والصورة المضيئة، وتنفذ التصنيف الثنائي بشكل مباشر من البداية إلى النهاية. تتمثل إسهاماتنا في جوانب متعددة: أولاً، نُظهر أنه من خلال تحسين خسارة الشبكة التوليدية (GAN) وخسارة التصنيف معًا، تتعلم الشبكة كلا المهمتين في آن واحد، حيث تُفيد كلتا المهمتين بعضهما البعض. ثانيًا، يُحسّن دمج ميزات الصور التي تختلف في مستويات الإضاءة داخل فرع التصنيف بشكل كبير من أداء الشبكة. وتشير التقييمات المقارنة على مجموعات بيانات معيارية حقيقية واصطناعية صعبة للغاية (ESI وSABS) إلى متانة نموذج TMT-GAN وتفوّقه على الأساليب المتطورة حاليًا.

المعايير القياسية

معيار قياسيالمنهجيةالمقاييس
video-background-subtraction-on-sabsTMT-GAN
F-measure: 0.838
Mean IoU: 0.72

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
شبكات GAN متعددة المهام واعية للإضاءة لفصل الخلفية والخلفية الأمامية | الأوراق البحثية | HyperAI