HyperAIHyperAI

Command Palette

Search for a command to run...

تعلم التوافق المكاني والهدف للتقسيم الكائنات في الفيديو المستند إلى الذاكرة

Li Hu Peng Zhang Bang Zhang Pan Pan Yinghui Xu Rong Jin

الملخص

يقوم هذا البحث بدراسة مشكلة تقسيم الأشياء في الفيديو شبه المشرف (VOS). أظهرت العديد من الدراسات أن النهج القائم على الذاكرة يمكن أن يكون فعالًا في تقسيم الأشياء في الفيديو. يعتمد معظم هذه النماذج على مطابقة البكسلات على المستوى المكاني والزماني. العيب الرئيسي للنهج القائم على الذاكرة هو أنه لا يأخذ بعين الاعتبار الترتيب التتابعي بين الإطارات ولا يستغل المعرفة على مستوى الشيء من الهدف. لمعالجة هذه المشكلة، نقترح إطار عمل تعلم التجانس المكاني والهدف للتقسيم شبه المشرف للأشياء في الفيديو القائم على الذاكرة، والذي نسميه LCM. يتم تطبيق آلية الذاكرة لاسترجاع البكسلات بشكل عالمي، وفي الوقت نفسه يتعلم التجانس المكاني لتحقيق تقسيم أكثر ثقة. يعزز الاستجابة للموقع تمييزًا أفضل بين الهدف والمشتتات. بالإضافة إلى ذلك، يُدخل LCM علاقة على مستوى الشيء من الهدف للحفاظ على التجانس المستمر للهدف، مما يجعل LCM أكثر مقاومةً للتراكم الخاطئ للأخطاء. تُظهر التجارب أن LCM الخاص بنا حقق أداءً رائدًا في كلا معايير DAVIS و Youtube-VOS. وقد حصلنا على المركز الأول في تحدي DAVIS 2020 لمهام التقسيم شبه المشرف للأشياء في الفيديو (semi-supervised VOS).


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp