شبكة قمع تبادليّة توليدية للإغلاق المُتسلسلة لتمييز الأشخاص

إعادة تحديد الأشخاص (re-id) تواجه التحدي الكبير المتمثل في الاحتجاز، حيث تحتوي الصور على حالات احتجاز وتُقدِّم معلومات أقل تمييزًا عن المشاة. ومع ذلك، تسعى بعض الدراسات باستمرار إلى تصميم وحدات معقدة لاستخلاص المعلومات الضمنية (بما في ذلك نقاط محاور الوضع البشري، وخرائط التغطية، والمعلومات المكانية). ونتيجة لذلك، تركز الشبكة على تعلُّم السمات التمييزية في مناطق الجسم غير المحجوبة، وتحقق تطابقًا فعّالًا حتى في حالات عدم التوافق المكاني. ورغم ذلك، لم تُركِّز دراسات قليلة على تكبير البيانات، نظرًا لأن طرق تكبير البيانات القائمة على نموذج واحد تُحقِّق تحسينًا محدودًا في الأداء. ولحل مشكلة الاحتجاز، نقترح شبكة جديدة تُسمَّى "شبكة قمع الاحتجاز التوليدية التراكمية التفاعلية" (IGOAS). وتشمل هذه الشبكة: 1) وحدة توليد احتجاز تراكمية، تُولِّد بيانات احتجاز من السهل إلى الصعب، مما يجعل الشبكة أكثر مقاومة للإعاقات من خلال تعلُّم تدريجي للإعاقات الأصعب، بدلاً من تعلُّم الإعاقات الأشد صعوبة مباشرة. و2) إطار عمل قمع تفاعلي عالمي (G&A) يحتوي على فرع عالمي وفرع قمع تفاعلي. يُستخرج الفرع العالمي سمات عالمية مستقرة للصور. أما الفرع التفاعلي للقمع، المدمج فيه وحدتان لقمع الاحتجاز، فيقلل من استجابة الاحتجاز المُولَّد ويُعزز تمثيل السمات المُنتبهة في مناطق الجسم غير المحجوبة. وأخيرًا، نحصل على وصف مميز للشخص المشي من خلال دمج سمات الفرعين، وهو وصف يمتاز بالمقاومة لمشكلة الاحتجاز. أظهرت التجارب على مجموعة بيانات محجوبة أداءً تنافسيًا متميزًا لـ IGOAS، حيث حققت 60.1% دقة في الترتيب الأول (Rank-1) و49.4% متوسط الدقة (mAP) على مجموعة بيانات Occluded-DukeMTMC.