Command Palette
Search for a command to run...
التحقق القابل للتوسع للشخص: معيار معياري
التحقق القابل للتوسع للشخص: معيار معياري
Shengjin Wang Qi Tian Lu Tian Liyue Shen Jingdong Wang Liang Zheng
الملخص
يُقدّم هذا البحث مجموعة بيانات جديدة عالية الجودة لتحديد الأشخاص عبر الكاميرات، وتُسمّى "Market-1501". بشكل عام، تُعاني المجموعات الحالية من ثلاث قيود رئيسية: أولاً، تقتصر على حجم محدود؛ ثانياً، تتكون من مربعات حدودية (bboxes) تم رسمها يدويًا، وهي غير متوفرة في البيئات الواقعية؛ ثالثاً، تحتوي على صورة واحدة فقط كمعلومة حقيقية (ground truth) وصورة واحدة فقط كاستعلام (query) لكل هوية (في بيئة مغلقة). وللتغلب على هذه المشكلات، يتميز مجموعة البيانات المقترحة "Market-1501" بثلاثة جوانب رئيسية. أولاً، تحتوي على أكثر من 32,000 مربع حدودي مُعلّم، بالإضافة إلى مجموعة تشتيتية (distractor set) تضم أكثر من 500,000 صورة، مما يجعلها أكبر مجموعة بيانات لتحديد الأشخاص عبر الكاميرات حتى تاريخه. ثانيًا، تم إنتاج الصور في مجموعة "Market-1501" باستخدام نموذج الأجزاء القابلة للتشويه (Deformable Part Model - DPM) كمُكتشف للمشاة. ثالثًا، تم جمع مجموعة البيانات في نظام مفتوح، حيث يتوفر لكل هوية عدة صور تحت كل كاميرا. كمساهمة ثانوية، مستوحاة من التطورات الحديثة في البحث عن الصور على نطاق واسع، يقترح هذا البحث وصفًا غير مُدرّب من نوع "حقيبة الكلمات" (unsupervised Bag-of-Words). وننظر إلى مهمة تحديد الأشخاص عبر الكاميرات على أنها مهمة خاصة ضمن مجال البحث عن الصور. وفي التجارب، نُظهر أن الوصف المقترح يحقق دقة تنافسية على مجموعات البيانات VIPeR وCUHK03 وMarket-1501، كما يُعدّ قابلاً للتوسع على مجموعة البيانات الكبيرة التي تضم 500,000 صورة.