HyperAIHyperAI
منذ 3 أشهر

الانكشاف المُسنَد للتحليل غير المُراقب للفصل الكائنات في الفيديو

Zhao Yang, Qiang Wang, Luca Bertinetto, Weiming Hu, Song Bai, Philip H.S. Torr
الانكشاف المُسنَد للتحليل غير المُراقب للفصل الكائنات في الفيديو
الملخص

تم التصدي لتقسيم كائنات الفيديو غير المراقبة غالبًا من خلال أساليب تعتمد على الشبكات العصبية التكرارية وتدفق البصريات. وعلى الرغم من تعقيدها، فإن هذه الأساليب تميل إلى التفضيل للعوامل الزمنية قصيرة المدى، وبالتالي تكون عرضة لتراكم الأخطاء، مما يؤدي إلى الانحراف مع مرور الوقت. علاوة على ذلك، يمكن لنماذج التقسيم الثابتة (الثابتة) للصورة، وحدها، أن تؤدي أداءً تنافسيًا مع هذه الأساليب، مما يشير بشكل أوضح إلى ضرورة إعادة النظر في طريقة نمذجة الاعتماد الزمني. مستوحى من هذه الملاحظات، نستعرض في هذا البحث استراتيجيات بسيطة لكنها فعالة لنمذجة الاعتماد الزمني الطويل الأمد. مستلهمين من مشغلات غير المحلية المُقدمة في [70]، نقدم تقنية تُمكّن من إقامة تطابق كثيف بين تمثيلات البكسل في إطار مرجعي "مُسنَد" وال إطار الحالي. هذا يسمح بتعلم الاعتماد المزدوج بين النقاط على مسافات طويلة دون الاعتماد على الإطارات الوسطية. وبلا تدريب مباشر (Online Supervision)، يمكن لنهجنا قمع الخلفية وتقسيم الكائن الأمامي بدقة حتى في السيناريوهات الصعبة، مع الحفاظ على أداء متسق على مدار الزمن. وبمتوسط دقة IoU قدره $81.7\%$، يحتل نهجنا المرتبة الأولى في قائمة التصنيف الخاصة بـ DAVIS-2016 بالنسبة للأساليب غير المراقبة، مع بقائه تنافسيًا أمام أحدث الأساليب شبه المراقبة المباشرة. ونقوم أيضًا بتقييم طريقة لدينا على مجموعة بيانات FBMS وبيانات الفيديو المُنتِجة للانتباه ViSal، حيث نُظهر نتائج تنافسية مع أحدث التقنيات.