تعزيز الصور لتصنيف الصور الكائنية باستخدام مزيج من الشبكة العصبية التلافيفية المُدرَّبة مسبقًا وآلة الدعم المتجهي
الشبكات العصبية تمثل وسيلة قوية لتصنيف صور الكائنات. يعتمد النهج المقترح لتصنيف فئات الصور الكائنية على دمج الشبكات العصبية التلافيفية (CNN) مع آلات المتجهات الداعمة (SVM). تُستخدم شبكة عصبية تلافيفية مُدرّبة مسبقًا، تُسمى Alex-Net، كمُستخرج لسمات النمط. وقد تم تدريب Alex-Net مسبقًا على مجموعة بيانات كبيرة لصور الكائنات تُعرف باسم ImageNet. بدلًا من تدريب الشبكة من الصفر، تُستخدم Alex-Net المُدرّبة مسبقًا على ImageNet. كما تُستخدم آلة المتجهات الداعمة (SVM) كمصنف قابل للتدريب. يتم إرسال متجهات السمات الناتجة من Alex-Net إلى SVM. وتُستخدم مجموعة بيانات STL-10 كصور كائنية، حيث يبلغ عدد الفئات عشرة فئات. ويتم تقسيم العينات التدريبية والاختبارية بشكل واضح. يتم تدريب صور الكائنات من مجموعة STL-10 باستخدام SVM مع تطبيق تكبير البيانات (Data Augmentation). ونستخدم طريقة تحويل النمط باستخدام الدالة الجيبية (cosine function). كما نطبّق بعض أساليب التكبير الأخرى مثل الدوران، الانحراف (skewing)، والتشوه المرن (elastic distortion). وباستخدام الدالة الجيبية، تم تحويل الأنماط الأصلية إلى نماذج مُحاذاة من اليسار، أو من اليمين، أو من الأعلى، أو من الأسفل. كما تم تحويلها إلى نماذج مُحاذاة من الوسط وتم توسيعها. وقد قلّت نسبة الخطأ في الاختبار بمقدار 0.435 نقطة مئوية، من 16.055% إلى 15.620%، وذلك بفضل تكبير البيانات باستخدام التحويل الجيبي. أما بالنسبة للأساليب الأخرى لتكبير البيانات مثل الدوران والانحراف والتشوه المرن، فقد ارتفعت نسب الخطأ مقارنةً بالحالة التي لا توجد فيها تكبيرات. وبلغ عدد البيانات المُكبرة 30 مرة عدد عينات التدريب الأصلية من مجموعة STL-10 التي تبلغ 5000 عينة. وبلغت نسبة الخطأ في الاختبار في التجربة 15.620% على عينات اختبار تبلغ 8000 صورة من مجموعة STL-10، مما يدل على فعالية تكبير الصور في تصنيف فئات الصور.