Command Palette
Search for a command to run...
TrickVOS: حقيبة من الحيل لفصل الأشياء في الفيديو
TrickVOS: حقيبة من الحيل لفصل الأشياء في الفيديو
Evangelos Skartados extsuperscript1*, Konstantinos Georgiadis extsuperscript1*, M. Kerim Yucel extsuperscript2*, Koskinas Ioannis extsuperscript1, Armando Domi extsuperscript1, Anastasios Drosou extsuperscript1, Bruno Manganelli extsuperscript2, Albert Saà-Garriga extsuperscript2
الملخص
تُعدُّ طرق شبكات الذاكرة الزمانية المكانية (STM) مهيمنةً في مجال تقسيم الأشياء في الفيديو شبه المشرف (SVOS) نظرًا لأدائها المتميز. في هذا العمل، نحدد ثلاثة جوانب رئيسية يمكن تحسينها في هذه الطرق؛ وهي: i) الإشارة الإشرافية، ii) التدريب الأولي، وiii) الوعي المكاني. ثم نقترح TrickVOS؛ وهي حقيبة من الحيل العامة التي لا تعتمد على أي طريقة محددة وتتناول كل جانب من خلال i) خسارة هجينة واعية بالهيكل، ii) نظام بسيط للتدريب الأولي للمفكِّك، وiii) تتبع رخيص يفرض قيودًا مكانية على تنبؤات النموذج. أخيرًا، نقترح شبكة خفيفة الوزن ونظهر أنَّها عند تدريبها باستخدام TrickVOS، تحقق نتائج تنافسية مع أفضل الطرق الحالية على مقاييس DAVIS وYouTube، بينما تكون واحدة من أولى الطرق القائمة على STM في SVOS التي يمكن تشغيلها بشكل فعلي في الوقت الحقيقي على جهاز محمول.