هندسة الشبكة العصبية المتشابهة ذات البوابة للتعريف بإعادة التعرف على الإنسان

التعرف على المشاة عبر عدة زوايا كاميرا، المعروف باسم إعادة تعريف الإنسان (Human Re-Identification)، هو مشكلة بحثية صعبة لها تطبيقات عديدة في المراقبة البصرية. مع ظهور الشبكات العصبية التلافيفية (CNNs) مرة أخرى، تم اقتراح العديد من هياكل الشبكات العصبية التلافيفية العميقة ثنائية الأطراف لتعزيز عملية إعادة تعريف الإنسان، وذلك بهدف تقريب صور الأزواج المتشابهة (أي نفس الهوية) وجعل صور الأزواج غير المتشابهة بعيدة عن بعضها البعض. ومع ذلك، فإن الشبكات الحالية تستخرج تمثيلات ثابتة لكل صورة بغض النظر عن الصور الأخرى التي يتم مقارنتها معها، ويتم هذا المقارنة فقط في المستوى النهائي. في هذا الإعداد، تكون الشبكة معرضة لخطر عدم استخراج الأنماط المحلية الدقيقة التي قد تكون ضرورية لتمييز الأزواج الإيجابية عن الأزواج السلبية الصعبة. في هذه الورقة البحثية، نقترح دالة تحكم (Gating Function) لتسليط الضوء بشكل اختياري على هذه الأنماط المحلية المشتركة الدقيقة من خلال مقارنة الخصائص الوسطى بين أزواج الصور. هذا ينتج تمثيلات مرنة لنفس الصورة وفقًا للصور التي يتم ربطها بها. نقوم بإجراء تجارب على قواعد بيانات CUHK03 وMarket-1501 وVIPeR ونظهر تحسينًا في الأداء مقارنة بهيكل شبكة Siamese CNN الأساسية.