تعلم الميزات العميقة باستخدام مقارنة المسافة النسبية لإعادة تعريف الشخص

تحديد نفس الفرد في مشاهد مختلفة هو مهمة مهمة ومعقدة في مجال المراقبة الفيديو الذكية. تكمن صعوبتها الرئيسية في كيفية الحفاظ على التشابه بين نفس الشخص رغم التغيرات الكبيرة في المظهر والهيكل، مع تمييز الأفراد المختلفين. في هذا البحث، نقدم إطارًا قابلاً للتوسع يعتمد على الشبكات العصبية العميقة لتعلم الخصائص لإعادة تحديد الشخص (Person Re-Identification)، ونوضح فعاليته في التعامل مع التحديات القائمة. بصفة خاصة، بالنظر إلى الصور التدريبية مع علامات الفئات (المعرفات الشخصية Person IDs)، نقوم أولاً بإنتاج عدد كبير من الوحدات الثلاثية، كل منها يحتوي على ثلاث صور، أي شخص واحد مع مرجع مطابق ومرجع غير مطابق. باعتبار هذه الوحدات كمدخلات، نبني شبكة عصبية تقنية لتقديم التمثيلات المتعددة الطبقات، ثم نتبعها بمقياس المسافة L2. من خلال تحسين المعلمات، يسعى الإطار الخاص بنا إلى تعظيم المسافة النسبية بين الزوج المطابق والزوج غير المطابق لكل وحدة ثلاثية. بالإضافة إلى ذلك، فإن إحدى المشكلات غير البسيطة التي تنشأ مع الإطار هي أن تنظيم الوحدات الثلاثية يزيد بشكل مكعب عدد الوحدات الثلاثية للتدريب، حيث يمكن أن تكون صورة واحدة متورطة في عدة وحدات ثلاثية. لحل هذه المشكلة، طورنا خطة جенيريك فعالة لإنشاء الوحدات الثلاثية وخوارزمية انخفاض تدرج محسنة (Optimized Gradient Descent Algorithm)، مما يجعل العبء الحسابي يعتمد بشكل أساسي على عدد الصور الأصلية بدلاً من عدد الوحدات الثلاثية. على عدة قواعد بيانات صعبة، حققت طريقتنا نتائجًا واعدة للغاية وأفضلت الطرق الرائدة الأخرى (State-of-the-Art Approaches).