MergedNET: نهج بسيط للتعلم في لحظة واحدة في الشبكات المماثلة بناءً على طبقات التشابه
تُستخدم الفئّات المدربة على فئات منفصلة وبعدد قليل من النقاط المُعلّمة في التعلم بأسلوب "واحدة فقط" (one-shot learning) لتحديد المفاهيم البصرية من فئات أخرى. في الآونة الأخيرة، تم استخدام الشبكات السيماسية (Siamese networks) وطبقات التشابه (similarity layers) لحل مشكلة التعلم بأسلوب واحد فقط، مما أسفر عن أداء متميز على مجموعات بيانات التعرف على الرموز البصرية. طوّرت عدة تقنيات على مر السنين لتحسين أداء هذه الشبكات في مهام التصنيف الدقيق للصور. وركّزت هذه التقنيات بشكل رئيسي على تحسين دوال الخسارة ودوال التنشيط، وتعزيز السمات البصرية، واستخدام التعلّم المتعدد المقاييس (multiscale metric learning)، بالإضافة إلى التدريب المسبق (pre-training) وضبط الدقة (fine-tuning) لشبكة الأساس (backbone network). في هذا العمل، نستعرض طبقات التشابه في مهام التعلم بأسلوب واحد فقط، ونُقدّم إطارين اثنين لدمج هذه الطبقات في شبكة مُدمجة تُسمّى MergedNet. وقد أظهرت MergedNet أداءً أفضل من النماذج الأساسية (baselines) من حيث دقة التصنيف على جميع المجموعات الأربع المستخدمة في التجربة، كما أظهرت قدرة على التعميم على مجموعات أخرى عند تدريبها على مجموعة miniImageNet.