التمييز السريع والدقيق للكائنات في الفيديو عبر تتبع الأجزاء

التمييز بين الأشياء في الفيديو عبر الإنترنت هو مهمة صعبة حيث يتطلب معالجة سلسلة الصور بشكل فوري ودقيق. لتمييز الكائن المستهدف عبر الفيديو، تم تطوير العديد من الطرق التي تعتمد على شبكات العصبونات التلافيفية (CNN) من خلال التعديل الشديد على قناع الكائن في الإطار الأول، مما يكون مرهقًا زمنيًا للتطبيقات عبر الإنترنت. في هذا البحث، نقترح خوارزمية سريعة ودقيقة لتمييز الأشياء في الفيديو يمكنها بدء عملية التمييز فور استلام الصور. أولاً، نستخدم طريقة تتبع قائمة على الأجزاء لمعالجة العوامل الصعبة مثل التشوه الكبير، الإخفاء، والخلفية المعقدة. بناءً على المربعات الحدودية المتتبعة للأجزاء، نقوم ببناء شبكة تمييز منطقة الاهتمام لإنتاج أقنعة الأجزاء. أخيرًا، يتم تبني دالة تقييم قائمة على التشابه لتحسين هذه أجزاء الكائن من خلال مقارنتها بالمعلومات البصرية في الإطار الأول. أدت طرقنا إلى نتائج مواتية مقابل الخوارزميات الأكثر تقدمًا من حيث الدقة على مجموعة بيانات DAVIS المرجعية، بينما حققت أداءً زمنيًا أسرع بكثير.