التعلم متعدد المهام مع الأولويات الخشنة لتحسين التعرف على الشخص المُدرك للجزء بشكل موثوق

تمثيلات المستويات الجزئية تُعدّ مهمة لتحقيق التعرف على الأشخاص بموثوقية عالية (ReID)، لكن في الممارسة العملية، تتأثر جودة الميزات بسبب مشكلة عدم التوافق المكاني بين الأجزاء الجسدية. في هذه الورقة، نقدّم طريقة قوية وصغيرة الحجم وسهلة الاستخدام تُسمّى الشبكة متعددة المهام المُتّقنة بالجزئيات (MPN)، المصممة لاستخراج ميزات جزئية ذات معنى متماسكة من صور المشاة. تحلّ MPN مشكلة عدم التوافق المكاني للأجزاء الجسدية من خلال التعلّم متعدد المهام (MTL) أثناء مرحلة التدريب. وبشكل أكثر تحديدًا، تقوم ببناء مهمة رئيسية (MT) ومهام مساعدة (AT) واحدة لكل جزء جسدي على قمة نموذج أساسي واحد. تُزوّد المهام المساعدة (AT) ببيانات أولية خشنة عن مواقع الأجزاء الجسدية في صور التدريب. ثم تُحوّل هذه المهام المساعدة المفاهيم المتعلقة بالأجزاء الجسدية إلى المهام الرئيسية (MT) من خلال تحسين معاملات المهمة الرئيسية لتحديد القنوات ذات الصلة بالجزء من النموذج الأساسي. ويتم تحقيق نقل المفاهيم من خلال استراتيجيتين جديدتين للتوافق: أولًا، التوافق في فضاء المعاملات عبر مشاركة المعاملات الصلبة (hard parameter sharing)، وثانيًا، التوافق في فضاء الميزات بطريقة مصنفة حسب الفئة (class-wise). وباستخدام المعاملات عالية الجودة التي تم تعلّمها، يمكن للمهام الرئيسية استخلاص ميزات جزئية متماسكة معًا من القنوات ذات الصلة بشكل مستقل أثناء مرحلة الاختبار. تتميّز MPN بثلاثة مزايا رئيسية: 1) لا تتطلب إجراء كشف عن الأجزاء الجسدية أثناء عملية الاستنتاج؛ 2) نموذجها صغير الحجم وفعال جدًا في كل من التدريب والاختبار؛ 3) في مرحلة التدريب، تتطلب فقط بيانات أولية خشنة عن مواقع الأجزاء الجسدية، وهي بيانات سهلة الحصول عليها. أظهرت التجارب المنهجية على أربع قواعد بيانات كبيرة لـ ReID أن MPN تتفوّق باستمرار على الطرق الرائدة في مجالها بفارق كبير. يمكن الوصول إلى الكود عبر الرابط: https://github.com/WangKan0128/MPN.