تعلم الأنماط المكانية-الزمنية على مستوى المثيلات لتحديد الأشخاص

تهدف إعادة تحديد الأشخاص (Re-ID) إلى مطابقة المشاة في كاميرات متفرقة. يُصاغ معظم مناهج Re-ID على شكل تعلم تمثيل بصري وبحث في الصور، وبالتالي فإن دقتها تتأثر بشكل كبير بحجم فضاء البحث. وقد أثبتت المعلومات المكانية-الزمنية فعاليتها في استبعاد العينات السلبية غير ذات الصلة، مما يُحسّن بشكل كبير دقة Re-ID. ومع ذلك، لا تزال مناهج Re-ID المكانية-الزمنية الحالية خشنة إلى حد ما، ولا تستغل المعلومات المكانية-الزمنية إلى أقصى حد. في هذه الورقة، نقترح منهجًا جديدًا يُسمى InSTD (Re-ID مُفَكَّك على مستوى المُثَلَّة والمعلومات المكانية-الزمنية)، بهدف تحسين دقة Re-ID. في الإطار المقترح، تُؤخذ المعلومات الشخصية، مثل اتجاه الحركة، بعين الاعتبار بشكل صريح، مما يُقلل بشكل إضافي من حجم فضاء البحث. علاوةً على ذلك، يتم فصل احتمالية النقل المكانية-الزمنية عن التوزيع المشترك إلى توزيعات هامشية، بحيث يمكن نمذجة القيم الشاذة (outliers) بشكل جيد أيضًا. تُقدَّم تحليلات تجريبية وفيرة، تُظهر تفوق الطريقة المقترحة وتُزوِّد بفهم أعمق لها. حققت الطريقة المقترحة مؤشر mAP بلغ 90.8% على مجموعة Market-1501 و89.1% على DukeMTMC-reID، مقارنةً بالأساسية التي كانت 82.2% و72.7% على التوالي. بالإضافة إلى ذلك، لتقديم معيار أفضل لاختبار إعادة تحديد الأشخاص، نُطلِق قائمة بيانات مُنظَّفة لـ DukeMTMC-reID مع هذه الورقة: https://github.com/RenMin1991/cleaned-DukeMTMC-reID/