منذ 2 أشهر
TrickVOS: حقيبة من الحيل لفصل الأشياء في الفيديو
Evangelos Skartados; Konstantinos Georgiadis; Mehmet Kerim Yucel; Koskinas Ioannis; Armando Domi; Anastasios Drosou; Bruno Manganelli; Albert Saa-Garriga

الملخص
تُعدُّ طرق شبكات الذاكرة الزمانية المكانية (STM) مهيمنةً في مجال تقسيم الأشياء في الفيديو شبه المشرف (SVOS) نظرًا لأدائها المتميز. في هذا العمل، نحدد ثلاثة جوانب رئيسية يمكن تحسينها في هذه الطرق؛ وهي: i) الإشارة الإشرافية، ii) التدريب الأولي، وiii) الوعي المكاني. ثم نقترح TrickVOS؛ وهي حقيبة من الحيل العامة التي لا تعتمد على أي طريقة محددة وتتناول كل جانب من خلال i) خسارة هجينة واعية بالهيكل، ii) نظام بسيط للتدريب الأولي للمفكِّك، وiii) تتبع رخيص يفرض قيودًا مكانية على تنبؤات النموذج. أخيرًا، نقترح شبكة خفيفة الوزن ونظهر أنَّها عند تدريبها باستخدام TrickVOS، تحقق نتائج تنافسية مع أفضل الطرق الحالية على مقاييس DAVIS وYouTube، بينما تكون واحدة من أولى الطرق القائمة على STM في SVOS التي يمكن تشغيلها بشكل فعلي في الوقت الحقيقي على جهاز محمول.