HyperAIHyperAI
منذ 2 أشهر

التحليل الدلالي البشري لإعادة التعرف على الشخص

Mahdi M. Kalayeh; Emrah Basaran; Muhittin Gokmen; Mustafa E. Kamasak; Mubarak Shah
التحليل الدلالي البشري لإعادة التعرف على الشخص
الملخص

إعادة التعرف على الشخص هي مهمة صعبة تعود أساساً إلى عوامل مثل الفوضى الخلفية، وضعية الجسم، الإضاءة واختلافات زاوية الكاميرا. هذه العناصر تعوق عملية استخراج التمثيلات القوية والمميزة، مما يمنع تمييز الهويات المختلفة بنجاح. لتحسين تعلم التمثيلات، يتم عادةً استخراج الخصائص المحلية من أجزاء جسم الإنسان. ومع ذلك، فإن الممارسة الشائعة لهذه العملية كانت تعتمد على اكتشاف أجزاء الصندوق الحدودي (bounding box part detection). في هذا البحث، نقترح استخدام تقسيم الدلالة البشري (human semantic parsing)، والذي بفضل دقة المستوى البكسلية وقدرته على نمذجة المحيطات العشوائية، يعتبر بديلاً طبيعياً أفضل. يدمج اقتراحنا SPReID تقنيات تقسيم الدلالة البشري في إعادة التعرف على الشخص، حيث لا يتفوق فقط بشكل كبير على النموذج الأساسي المقابل له، بل يصل أيضاً إلى أداء رائد في المجال. كما نوضح أن استخدام استراتيجية تدريب \textit{بسيطة} ولكن فعالة يمكن أن يجعل العمليات الهندسية العميقة الشائعة مثل Inception-V3 وResNet-152، دون أي تعديل وفي حالة العمل حصراً على الصورة الكاملة، تتخطى الأداء الرائد الحالي بشكل كبير. تحسن الطرق المقترحة لدينا أحدث ما تم الوصول إليه في مجال إعادة التعرف على الشخص في: Market-1501 بنسبة ~17% في mAP و~6% في الرتبة الأولى (rank-1)، CUHK03 بنسبة ~4% في الرتبة الأولى (rank-1) وDukeMTMC-reID بنسبة ~24% في mAP و~10% في الرتبة الأولى (rank-1).