HyperAIHyperAI
منذ 11 أيام

نمط ت modulation موثوق للإنتشار-التصحيح لفصل كائن الفيديو

Xiaohao Xu, Jinglu Wang, Xiao Li, Yan Lu
نمط ت modulation موثوق للإنتشار-التصحيح لفصل كائن الفيديو
الملخص

يُعد انتشار الأخطاء مشكلة عامة ولكنها بالغة الأهمية في تجزئة كائنات الفيديو شبه المُعلَّمة عبر الإنترنت. ونهدف إلى تقليل انتشار الأخطاء من خلال آلية تصحيح تتمتع بموثوقية عالية. والرؤية الأساسية تكمن في فصل عملية التصحيح عن عملية انتشار القناع التقليدية باستخدام إشارات موثوقة. نقدّم نوعين من المُعدّلات: مُعدّل الانتشار ومُعدّل التصحيح، لإجراء إعادة ضبط فعّالة على مستويات القنوات في تمثيلات الإطار الهدف، وذلك وفقًا للتوصيلات الزمنية المحلية والإشارات الموثوقة على التوالي. وبشكل خاص، نقوم بتجميع هاتين المُعدّلتين ضمن مخطط متسلسل للانتشار-التصحيح، مما يمنع تجاوز تأثير مُعدّل التصحيح الموثوق من قبل مُعدّل الانتشار. وعلى الرغم من أن الإطار المرجعي الذي يحتوي على التسمية الحقيقية يوفر إشارات موثوقة، فإنه قد يختلف كثيرًا عن الإطار الهدف، ما يؤدي إلى توصيلات غير مؤكدة أو غير كاملة. ولتعزيز إشارات المرجع، نُكمّلها بوضع بقع ميزة موثوقة في حوض مُحفوظ، مما يوفر تمثيلات كائنية أكثر شمولاً وتعبيرًا للمُعدّلتين. بالإضافة إلى ذلك، تم تصميم مرشح موثوقية لاسترجاع البقع الموثوقة وتمريرها إلى الإطارات اللاحقة. تُظهر نتائج تجاربنا الواسعة أن نموذجنا يحقق أداءً متميزًا على مجموعتي بيانات YouTube-VOS18/19 وDAVIS17-Val/Test. وتُثبت التجارب الموسعة أن آلية التصحيح توفر تحسينًا كبيرًا في الأداء من خلال الاستفادة الكاملة من التوجيه الموثوق. يُمكن الاطلاع على الكود من خلال الرابط التالي: https://github.com/JerryX1110/RPCMVOS.

نمط ت modulation موثوق للإنتشار-التصحيح لفصل كائن الفيديو | أحدث الأوراق البحثية | HyperAI