DARI: دمج مقياس المسافة وتمثيل الشخص للتحقق من الهوية الشخصية

شهد العقد الماضي تطورًا سريعًا في تعلم تمثيل الخصائص وتعلم مقياس المسافة، مع أن الخطوتين غالبًا ما يتم مناقشتهما بشكل منفصل. لاستكشاف التفاعل بينهما، يقترح هذا العمل إطارًا تعليميًا شاملًا يُسمى DARI، أي دمج مقياس المسافة وتمثيل الخصائص (Distance metric And Representation Integration)، ويتحقق من فعالية DARI في المهمة الصعبة لتحقق الهوية الشخصية. بالنظر إلى صور التدريب المصحوبة بالعلامات، نقوم أولاً بإنتاج عدد كبير من الوحدات الثلاثية، وكل واحدة تحتوي على ثلاث صور، وهي صورة شخص واحد والمرجع المطابق أو غير المطابق له. بالنسبة لكل وحدة ثلاثية، يكون الهدف هو زيادة الاختلاف في المسافة بين الزوج المطابق والزوج غير المطابق قدر الإمكان. نحل هذه المشكلة ببناء هندسة عميقة للشبكات العصبية التلافيفية. بشكل خاص، يتم تحليل مصفوفة مسافة Mahalanobis بشكل طبيعي كطبقة متصلة كاملة في الأعلى التي يتم دمجها بسلاسة مع الطبقات الأخرى في الأسفل التي تمثل خصائص الصورة. يمكن بالتالي تحسين خصائص الصورة ومقياس المسافة بشكل متزامن عبر انتشار العكس مرة واحدة. على عدة مجموعات بيانات عامة، أظهرت DARI أداءً واعدًا للغاية في إعادة تحديد الأفراد عبر الكاميرات المختلفة رغم التحديات المتعددة، وأفضلت أداءها عن باقي النهج الرائدة الأخرى.