تعلم الخصائص متعددة المقياس لإعادة تعريف الشخص

كمشكلة في التعرف على المستويات الفردية، يعتمد التعرف مجددًا على الأشخاص (ReID) على الخصائص المميزة التي تلتقط ليس فقط مقاييس فضائية مختلفة ولكنها أيضًا تحتوي على تركيبة عشوائية من عدة مقاييس. نطلق على هذه الخصائص التي تشمل المقاييس المتجانسة وغير المتجانسة اسم الخصائص متعددة المقاييس (omni-scale features). في هذا البحث، تم تصميم شبكة عصبية جديدة وعميقة لـ ReID، سميت بشبكة متعددة المقاييس (Omni-Scale Network - OSNet)، للتعلم من الخصائص متعددة المقاييس. يتم تحقيق ذلك من خلال تصميم كتلة بواقي تتكون من عدة تيارات ارتكازية، كل منها يكتشف خصائصًا عند مستوى معين. وبشكل مهم، تم تقديم بوابة تجميع موحدة جديدة تقوم بدمج الخصائص متعددة المقاييس بشكل ديناميكي باستخدام أوزان قنوات تعتمد على الإدخال. لتعلم الارتباطات الفضائية-القنوية بكفاءة وتجنب الانطباع الزائد، تستخدم الكتلة الأساسية عمليات الارتكاز النقطي والعميق. عن طريق تراكم هذه الكتلة طبقةً فوق طبقة، يكون نظامنا OSNet خفيف الوزن للغاية ويمكن تدريبه من الصفر على معايير ReID الموجودة. رغم صغر حجم نموذجه، حقق OSNet أداءً رائدًا في ستة مجموعات بيانات للتعرف مجددًا على الأشخاص، مما يجعله أفضل من معظم النماذج الكبيرة الحجم غالبًا بمargins واضحة. يمكن الوصول إلى الشفرة والنماذج عبر الرابط: \url{https://github.com/KaiyangZhou/deep-person-reid}.