التعلم التمييزي والولادي المشترك لإعادة تحديد الشخص

تظل مشكلة إعادة تحديد الشخص (Re-ID) صعبة بسبب التباينات الكبيرة داخل الفئة الواحدة عبر كاميرات مختلفة. في الآونة الأخيرة، ازداد الاهتمام باستخدام النماذج التوليدية لتوسيع بيانات التدريب وتعزيز الثبات تجاه تغيرات المدخلات. ومع ذلك، تبقى أنابيب الإنتاج في الأساليب الحالية نسبيًا منفصلة عن مراحل التعلم التمييزي لإعادة التحديد. وفقًا لذلك، يتم تدريب نماذج Re-ID غالبًا بطريقة مباشرة على البيانات المُنتجة. في هذا البحث، نسعى إلى تحسين تمثيلات إعادة تحديد الشخص المُتعلمة من خلال الاستفادة بشكل أفضل من البيانات المنتجة. لهذا الغرض، نقترح إطار عمل للتعلم المشترك يربط بين تعلم إعادة تحديد الشخص وإنتاج البيانات بشكل متصل. يتضمن نموذجنا وحدة إنتاجية تقوم بتشفير كل شخص بشكل منفصل إلى رمز مظهر (Appearance Code) ورمز بنية (Structure Code)، بالإضافة إلى وحدة تمييزية تشترك في مُشفِّر المظهر مع الوحدة الإنتاجية. من خلال تبديل أكواد المظهر أو البنية، تكون الوحدة الإنتاجية قادرة على إنشاء صور مركبة عالية الجودة عبر الأشخاص المختلفين، والتي يتم تقديمها بدورها بشكل مباشر إلى مُشفِّر المظهر واستخدامها لتحسين الوحدة التمييزية. يحقق الإطار العمل المقترح للتعلم المشترك تحسينًا كبيرًا على النموذج الأساسي دون استخدام البيانات المنتجة، مما يؤدي إلى أداء رائد على عدة مجموعات بيانات مرجعية.