VehicleNet: تعلّم تمثيل الميزات القوي لتحديد الهوية الآلي للمركبات
إحدى التحديات الأساسية في مسألة التعرف على المركبات (re-id) تكمن في تعلُّم تمثيل بصري قوي وتمييزي، بالنظر إلى التباين الكبير بين الفئات داخل المركبات عبر مناظير مختلفة. وبما أن المجموعات المتاحة حاليًا من بيانات المركبات محدودة من حيث عدد الصور التدريبية ونُظُر الكاميرات، نقترح بناء مجموعة بيانات كبيرة فريدة من نوعها للمركبات (تُسمى VehicleNet) من خلال دمج أربع مجموعات بيانات عامة للمركبات، وتصميم نهج مبتكر وفعّال على مرحلتين لتعلم تمثيل بصري أكثر قوة من خلال VehicleNet. المرحلة الأولى من النهج تتمثل في تعلُّم تمثيل عام لجميع المجالات (أي مجموعات بيانات المركبات المصدرية) من خلال التدريب باستخدام خسارة التصنيف التقليدية. تخفف هذه المرحلة من التماثل الكامل بين المجال التدريبي والمجال التجريبي، لأنها لا تعتمد على المجال المستهدف للمركبات. أما المرحلة الثانية فهي تُعدِّل النموذج المُدرَّب بالكامل بناءً على مجموعة المركبات المستهدفة، وذلك بتقليل الفرق في التوزيع بين VehicleNet و أي مجال مستهدف. نناقش مجموعة البيانات متعددة المصادر المُقترحة VehicleNet، ونقيّم فعالية تعلُّم التمثيل التدريجي على مرحلتين من خلال تجارب واسعة النطاق. وحققنا دقة متفوقة بـ 86.07% mAP على مجموعة الاختبار الخاصة بتحدي AICity، ونتائج تنافسية على مجموعتي بيانات مركبات عامتين أخريين، وهما VeRi-776 و VehicleID. نأمل أن تُسهم مجموعة البيانات الجديدة VehicleNet والتمثيلات البصرية القوية التي تم تعلُّمها في تمكين تطوير تطبيقات التعرف على المركبات في البيئات الواقعية.