HyperAIHyperAI
منذ 17 أيام

الشيطان في التفاصيل: محاذاة المؤشرات البصرية للإدراج الشرطي في إعادة تحديد الأشخاص

Fufu Yu, Xinyang Jiang, Yifei Gong, Shizhen Zhao, Xiaowei Guo, Wei-Shi Zheng, Feng Zheng, Xing Sun
الشيطان في التفاصيل: محاذاة المؤشرات البصرية للإدراج الشرطي في إعادة تحديد الأشخاص
الملخص

على الرغم من التقدم المحرز في مهمة التعرف على الأشخاص (Person Re-Identification)، تظل الحالات الصعبة مثل التغطية (الإغلاق)، وتغير زاوية الرؤية، والملابس المتشابهة تمثل تحديات كبيرة. بالإضافة إلى الخصائص البصرية الشاملة، فإن مطابقة ومقارنة المعلومات التفصيلية تُعد أيضًا أمرًا بالغ الأهمية لمواجهة هذه التحديات. تُقدّم هذه الورقة نمطين رئيسيين للتمييز، بهدف الاستفادة بشكل أفضل من المعلومات التفصيلية في صور المشاة، والتي لا تُلبّيها معظم الطرق الحالية. أولاً، يتطلب "تموضع المؤشرات البصرية" (Visual Clue Alignment) من النموذج اختيار أزواج من المناطق الحاسمة من صورتين ومحاذاة هذه الأزواج لإجراء مقارنة زوجية، في حين أن الطرق الحالية تُحدّد فقط محاذاة مناطق وفق قواعد مسبقة مثل التشابه العالي في الميزات أو التسميات الدلالية نفسها. ثانيًا، يُطلَب من "التمثيل المُشَرَّط للميزات" (Conditional Feature Embedding) تعديلًا ديناميكيًا للميزة الشاملة للصورة المُستفسَرة بناءً على الصورة التي تتم مطابقتها منها في المعرض (gallery)، في حين تتجاهل معظم الطرق الحالية الصور المرجعية. من خلال إدخال تقنيات جديدة، منها وحدة الانتباه للتوافق (correspondence attention module) وشبكة تفاعلية قائمة على الفروق (discrepancy-based GCN)، نقترح طريقة متكاملة ونهاية إلى نهاية (end-to-end) للتمييز (ReID)، تُدمج كلا النمطين في إطار موحد يُسمى CACE-Net (C)lue(A)lignment and (C)onditional (E)mbedding. أظهرت التجارب أداءً متميزًا على مستوى الحد الأقصى (state-of-the-art) على ثلاث مجموعات بيانات عامة.

الشيطان في التفاصيل: محاذاة المؤشرات البصرية للإدراج الشرطي في إعادة تحديد الأشخاص | أحدث الأوراق البحثية | HyperAI