MobileVOS: تقسيم الأشياء في الفيديو الزمني الحقيقي التعلم التبايني يلتقي بتنقية المعرفة

يتعامل هذا البحث مع مشكلة تقسيم الأشياء في الفيديو بشكل شبه مشرف على أجهزة ذات إمكانات محدودة، مثل الهواتف المحمولة. نصيغ هذه المشكلة كمهمة تقطير، حيث نثبت أن شبكات الزمان والمكان والذاكرة الصغيرة ذات الذاكرة المحدودة يمكنها تحقيق نتائج تنافسية مع أفضل التقنيات الحالية، ولكن بجزء صغير من التكلفة الحسابية (32 ملي ثانية لكل إطار على هاتف سامسونج جالاكسي S22). تحديداً، نقدم إطاراً نظرياً مدروساً يوحّد بين تقطير المعرفة وتعلم التمثيل التضادي المشرف. هذه النماذج قادرة على الاستفادة المشتركة من كل من تعلم التباين البكسل ببكسل وتقطير معلم مدرب مسبقًا. نؤكد صحة هذه الدالة الخسارة من خلال تحقيق درجات تنافسية في مؤشري J&F مع أفضل التقنيات الحالية على مقاييس DAVIS وYouTube القياسية، رغم أنها تعمل بسرعة تصل إلى 5 مرات أسرع وبـ 32 مرة أقل من عدد المعالم.