VehicleNet: تعلّم تمثيل بصري موثوق لتحديد الهوية المرورية

أحد التحديات الأساسية في إعادة التعرف على المركبات (re-id) يتمثل في تعلّم تمثيل بصري قوي وتمييزية، بالنظر إلى التباينات الداخلية الكبيرة بين الفئات المختلفة للمركبات عبر زوايا كاميرات متعددة. وبما أن المجموعات الحالية من بيانات المركبات محدودة من حيث عدد الصور التدريبية وعدد الزوايا المرئية، نقترح بناء مجموعة بيانات كبيرة وفريدة من نوعها للمركبات (تُسمى VehicleNet) من خلال دمج أربع مجموعات بيانات عامة للمركبات، وتصميم نهج تدريجي مكوّن من مرحلتين بسيط وفعال لتعلم تمثيل بصري أكثر قوة من خلال VehicleNet. تتمثل المرحلة الأولى من هذا النهج في تعلّم تمثيل عام لجميع المجالات (أي مجموعات بيانات المركبات المصدرية) من خلال التدريب باستخدام خسارة التصنيف التقليدية. تُخفّف هذه المرحلة من التوافق الكامل بين مجالات التدريب والاختبار، نظرًا لأنها لا تعتمد على المجال المستهدف للمركبات. أما المرحلة الثانية، فهي تخصيص النموذج المُدرّب بالكامل بناءً على مجموعة المركبات المستهدفة، وذلك من خلال تقليل الفرق في التوزيع بين VehicleNet وجميع المجالات المستهدفة. نناقش المجموعة المتعددة المصادر VehicleNet التي نقترحها، ونقيّم فعالية التعلّم التدريجي للتمثيل من خلال تجارب واسعة النطاق. وحققنا دقة قياسية تبلغ 86.07% من mAP على مجموعة الاختبار الخاصة في مسابقة AICity Challenge، ونتائج تنافسية على مجموعتي بيانات عامتين أخريين لـ re-id للمركبات، وهما VeRi-776 وVehicleID. نأمل أن تُسهم هذه المجموعة الجديدة VehicleNet والتمثيلات القوية التي تم تعلّمها في تمكين تطوير تطبيقات إعادة التعرف على المركبات في البيئات الواقعية.