SeqNet: الشبكات التسلسلية للتعرف على لوحات الإشارة في المرة الواحدة باستخدام التعلم الناقل
في مهام تمييز إشارات المرور، يُعد تمييز إشارات الطرق من خلال ملاحظة صور مرجعية مُصَنَّعة قُدرةً بشريّةً يمكن لأحد خوارزميات التعلّم من مثال واحد (One-shot Learning) تنفيذها. يُعد تمييز الكائنات من مثال واحد تحديًا كبيرًا للشبكات العصبية العميقة، حيث تقوم النموذج العميق بتصنيف الأمثلة الاستعلامية بناءً على صور الدعم. ويصبح الأمر أكثر صعوبة عندما يوجد انزياح في المجال (Domain Shift) بين عينات الدعم والاستعلام. كما يُعد التعميم للنموذج العميق على مجال غير معروف يختلف في توزيعه أمرًا صعبًا آخر في التمييز من مثال واحد. تقدّم هذه الدراسة شبكة عميقة جديدة تُسمّى SeqNet لتجاوز المشكلات المذكورة أعلاه. وبما نعلم، تتفوّق هذه الدراسة على جميع النماذج الرائدة في مجال تمييز إشارات المرور من مثال واحد وتمييز الشعارات من مثال واحد، وذلك بفضل نتائجها المتفوّقة. يُظهر نموذج SeqNet الذي اقترحناه قدرة على التعميم على مجالات غير مرئية دون الحاجة إلى تحسين النموذج (Fine-tuning) إضافيًا على بيانات الاختبار. كما نُظهر كيف يمكن لاستخدام المعرفة المنقولة من مجال كبير ولكن غير ذي صلة أن يقلّل من عدد المعلمات في الشبكة، ما يؤدي إلى تقليل حجم النموذج. وباستخدام قوة المعرفة المنقولة من نموذج عميق كبير، تصبح SeqNet أصغر حجمًا وتحتوي على ما يقارب 6 أضعاف أقل عدد من المعلمات مقارنةً بمنافساتها. يُمكّن الحجم الصغير لهيكل SeqNet من استخدامها في الأجهزة ذات الموارد المحدودة في العديد من التطبيقات، مثل المركبات الذكية. وتُظهر النتائج التجريبية أن أداء نموذج SeqNet المُقترح يتحسّن بشكل كبير، بزيادة تصل إلى 20% في دقة التصنيف من مثال واحد، و30% في مساحة تحت منحنى التقييم (AUC) في مهام استرجاع الصور.