HyperAIHyperAI
منذ 15 أيام

استغلال التعرف على الأشخاص في الفيديو بدون تدريب مراقب متين

Xianghao Zang, Ge Li, Wei Gao, Xiujun Shu
استغلال التعرف على الأشخاص في الفيديو بدون تدريب مراقب متين
الملخص

تُعتمد طرق التعرف على الأشخاص في مقاطع الفيديو غير المُشرَّفة (reID) عادةً على السمات على المستوى العالمي. وعندما تم استخدام السمات على المستوى المحلي في العديد من الطرق المُشرَّفة، أُحرز تحسين ملحوظ في الأداء. ومع ذلك، قد يؤدي تطبيق السمات على المستوى المحلي في الطرق غير المُشرَّفة إلى تقلبات غير مستقرة في الأداء. ولتحسين استقرار الأداء في التعرف على الأشخاص في مقاطع الفيديو غير المُشرَّفة، تقدّم هذه الورقة خطة عامة تدمج نماذج الأجزاء مع التعلم غير المُشرَّف. في هذه الخطة، يتم تقسيم السمة على المستوى العالمي إلى سمات محلية متساوية. ويُستخدم وحدة واعية بالجزء لاستكشاف الإمكانيات الكامنة للسمات على المستوى المحلي في التعلم غير المُشرَّف. كما تم اقتراح وحدة واعية بالعالم لتغلب على العيوب المرتبطة بالسمات على المستوى المحلي. وتُدمج السمات المستمدة من هاتين الوحدتين لتكوين تمثيل سمة قوي لكل صورة مدخلة. ويتمتع هذا التمثيل السمي بفوائد السمات على المستوى المحلي دون التعرض لعيوبها. أُجريت تجارب شاملة على ثلاث معايير، تشمل PRID2011 وiLIDS-VID وDukeMTMC-VideoReID، وأظهرت النتائج أن النهج المقترح يحقق أداءً من الدرجة الأولى (state-of-the-art). كما أظهرت الدراسات التحليلية الواسعة فعالية ومتانة الخطة المقترحة، والوحدة الواعية بالجزء، والوحدة الواعية بالعالم. يُتاح الكود والسمات المولّدة على الرابط التالي: https://github.com/deropty/uPMnet.

استغلال التعرف على الأشخاص في الفيديو بدون تدريب مراقب متين | أحدث الأوراق البحثية | HyperAI