الشبكات العصبية العميقة ذات التحويلات المكانية الموزونة للتعرف الدقيق على السيارات
تهدف التعرف الدقيق على السيارات إلى تحديد معلومات الفئة المتعلقة بالسيارة، مثل العلامة التجارية، والنوع، أو حتى سنة التصنيع. أظهرت عدد من الدراسات الحديثة أن الشبكة العصبية التلافيفية العميقة (DCNN) التي تم تدريبها على مجموعة بيانات كبيرة يمكنها تحقيق نتائج مذهلة في مهام تصنيف الكائنات العامة. في هذا البحث، نقترح استراتيجية تسمى "تجميع موزون مكانيًا" (SWP)، التي تُحسّن بشكل كبير من مرونة وفعالية تمثيل الميزات في معظم الشبكات العصبية التلافيفية العميقة الشائعة. بشكل أكثر تحديدًا، يُعدّ SWP طبقة تجميع جديدة تحتوي على عدد مُحدد مسبقًا من الأقنعة الموزونة مكانيًا أو قنوات التجميع. يقوم SWP بتجميع الميزات المستخرجة من الشبكات العصبية التلافيفية العميقة بمراعاة الأقنعة المُتعلمة، والتي تقيس أهمية الوحدات المكانية من حيث القدرة على التمييز. وبخلاف الطرق الحالية التي تطبّق تجميع الشبكة الموحدة على خرائط الميزة التلافيفية للشبكات العصبية التلافيفية العميقة، يمكن للطريقة المقترحة استخراج الميزات التلافيفية وإنشاء قنوات التجميع من خلال شبكة عصبية تلافيفية واحدة فقط. وبالتالي، لا يتطلب الأمر سوى تعديل بسيط من حيث التنفيذ. علاوة على ذلك، يمكن تعلّم 매ارم طبقة SWP ضمن عملية التدريب من البداية إلى النهاية للشبكة العصبية التلافيفية العميقة. وبتطبيق طريقة الاقتراح على عدة مجموعات بيانات للتعرف الدقيق على السيارات، نُظهر أن الطريقة المقترحة تحقق أداءً أفضل من الطرق الحديثة المنشورة في الأدبيات. ونُحسّن من نتائج الحالة الراهنة من خلال رفع الدقة من 92.6% إلى 93.1% على مجموعة بيانات Stanford Cars-196، ومن 91.2% إلى 97.6% على مجموعة بيانات CompCars الحديثة. كما قمنا باختبار الطريقة المقترحة على مجموعتي بيانات إضافيتين كبيرتي الحجم، وأظهرت النتائج نجاحًا ملحوظًا.