HyperAIHyperAI
منذ 2 أشهر

إطار التعلم المتقدم متعدد المهام وتنقية الضوضاء للاعتراف الدقيق بالمركبات

Liu, Dichao
إطار التعلم المتقدم متعدد المهام وتنقية الضوضاء للاعتراف الدقيق بالمركبات
الملخص

التعرف الدقيق على المركبات (FGVR) هو تقنية أساسية ضرورية لأنظمة النقل الذكية، لكنه يعتبر صعبًا للغاية بسبب التباين داخل الفئات المتأصل فيه. ركزت معظم الدراسات السابقة في مجال FGVR على التباين داخل الفئة الناجم عن زوايا التصوير المختلفة والمواقع وما إلى ذلك، بينما حظي التباين داخل الفئة الناجم عن الضوضاء في الصورة باهتمام قليل نسبيًا. يقترح هذا البحث إطار تعلم متعدد المهام تدريجي مضاد للضوضاء (PMAL) وإطار تقطير متعدد المهام تدريجي (PMD) لحل مشكلة التباين داخل الفئة في FGVR بسبب الضوضاء في الصورة. يحقق الإطار PMAL دقة اعتراف عالية من خلال معالجة إزالة الضوضاء من الصور كمهمة إضافية في عملية التعرف على الصور ودفع النموذج بشكل تدريجي لتعلم ثبات الضوضاء. يقوم الإطار PMD بنقل معرفة النموذج الذي تم تدريبه باستخدام PMAL إلى الشبكة الأساسية الأصلية، مما ينتج عنه نموذج يحقق دقة اعتراف مشابهة تقريبًا لتلك التي حققها النموذج الذي تم تدريبه باستخدام PMAL، ولكن دون أي أعباء إضافية على الشبكة الأساسية الأصلية. عند الجمع بين الإطارين، نحصل على نماذج تتفوق بشكل كبير على الأساليب الرائدة سابقًا في دقة الاعتراف على مجموعتين قياسيتين ومعتمدتين لمجموعات بيانات FGVR، وهما مجموعة بيانات سيارات ستانفورد (Stanford Cars) ومجموعة بيانات CompCars، بالإضافة إلى ثلاث مجموعات بيانات أخرى تعتمد على صور المراقبة للتعرف على أنواع المركبات، وهي مجموعة بيانات BIT-Vehicle التابعة للمعهد التقني لجامعة بكين (Beijing Institute of Technology)، ومجموعة بيانات Vehicle Type Image Data 2 (VTID2)، ومجموعة بيانات Vehicle Images Dataset for Make Model Recognition (VIDMMR)، دون أي أعباء إضافية على الشبكات الأساسية الأصلية. يمكن الوصول إلى الكود المصدر من الرابط https://github.com/Dichao-Liu/Anti-noise_FGVR

إطار التعلم المتقدم متعدد المهام وتنقية الضوضاء للاعتراف الدقيق بالمركبات | أحدث الأوراق البحثية | HyperAI