SVDNet لاسترجاع الأشخاص

يقترح هذا البحث شبكة SVDNet لحل مشاكل الاسترجاع، مع التركيز على تطبيق إعادة التعرف على الأشخاص (Re-ID). نعتبر كل متجه وزن داخل طبقة متصلة بالكامل (FC) في شبكة العصبونات التلافيفية (CNN) كأساس للإسقاط. وقد لوحظ أن متجهات الوزن تكون غالبًا ذات صلة عالية بينها. يؤدي هذا المشكلة إلى وجود علاقات بين عناصر وصفة الطبقة المتصلة بالكامل (FC)، مما يضعف أداء الاسترجاع المستند إلى المسافة الأقليدية (Euclidean distance). لمعالجة هذه المشكلة، يقترح هذا البحث تحسين عملية تعلم التمثيل العميق باستخدام تحليل المتجهات المنفردة (SVD). وبشكل خاص، من خلال استخدام نظام التدريب القائم على القيود والاسترخاء التكراري (RRI)، نتمكن من دمج قيد التعامد بشكل تكراري في تدريب الشبكة العصبية التلافيفية (CNN)، مما ينتج عنه ما يعرف بشبكة SVDNet. أجرينا التجارب على مجموعات البيانات Market-1501 وCUHK03 وDuke، وأظهرنا أن RRI يقلل بشكل فعال من العلاقات بين متجهات الإسقاط، ويولد وصفات FC أكثر تمييزًا، ويعزز بشكل كبير دقة إعادة التعرف على الأشخاص (Re-ID). على سبيل المثال، في مجموعة بيانات Market-1501، ارتفعت الدقة المرتبة الأولى (Rank-1 accuracy) من 55.3% إلى 80.5% لشبكة CaffeNet، ومن 73.8% إلى 82.3% لشبكة ResNet-50.