التكيف بين مجالات الصور مع الحفاظ على التشابه الذاتي وعدم التشابه بين المجالات لتحديد الشخص مجددًا

تُعاني نماذج إعادة التعرف على الشخص (إعادة التعرف) التي تم تدريبها في مجال واحد من عدم القدرة على التعميم بشكل جيد إلى مجال آخر. في محاولتنا، نقدم إطارًا يُسمى "التعلم عبر الترجمة". في النموذج الأساسي، نقوم بترجمة الصور المُسَمَّة من المجال المصدر إلى المجال الهدف بطريقة غير مراقبة. ثم نقوم بتدريب نماذج إعادة التعرف باستخدام الصور المترجمة بواسطة طرق مراقبة. ومع ذلك، فإن الترجمة غير المراقبة للصورة-الصورة هي جزء أساسي من هذا الإطار، وتتعرض لفقدان المعلومات الموجودة في علامات المجال المصدر أثناء الترجمة.دوافعنا متعددة الأوجه. أولاً، يجب الحفاظ على العناصر المميزة التي تحتوي عليها كل صورة في علامة هويتها بعد عملية الترجمة. ثانياً، بالنظر إلى حقيقة أن المجالين يحتويان على أشخاص مختلفين تمامًا، يجب أن تكون الصورة المترجمة غير مشابهة لأي من الهويات الهدف. لتحقيق هذا الغرض، نقترح الحفاظ على نوعين من الشبهات غير المراقبة: 1) شبه الذاتية للصورة قبل وبعد الترجمة، و2) الاختلاف بين المجالين للصورة المصدر المترجمة والصورة الهدف. يتم تنفيذ كلا القيدَيْن في شبكة التنافسية الجenerative التي تحافظ على الشبه (SPGAN)، والتي تتكون من شبكة توأمية (Siamese network) وشبكة CycleGAN. من خلال تجربة تكيف المجال، نظهر أن الصور التي تم إنشاؤها بواسطة SPGAN أكثر ملاءمة لتكييف المجال وتحقق دقة إعادة تعرف تنافسية ومتسقة على قاعدتين بيانات كبيرتين.