الاستخلاص السريع والمتين للسمات: قوة التدريب النادر الموفر للطاقة للـ Autoencoders

تُولِّد الزيادة الأخيرة في كمية البيانات عالية الأبعاد مشكلات كبيرة، تشمل تكاليف حسابية عالية ومتطلبات ذاكرة كبيرة. وقد تم تقديم اختيار الميزات، الذي يُعرّف الميزات الأكثر صلة وفائدة ضمن مجموعة البيانات، كحل لهذه المشكلة. ومع ذلك، فإن معظم الطرق الحالية لاختيار الميزات تُعد غير فعالة من حيث الحساب، حيث تؤدي الخوارزميات غير الفعالة إلى استهلاك طاقة مرتفع، وهو أمر غير مرغوب في الأجهزة التي تمتلك موارد حسابية وطاقة محدودة. في هذا البحث، تم اقتراح طريقة جديدة ومُحكَمة لاختيار الميزات غير المُشرَّفة. وتُسمَّى هذه الطريقة "QuickSelection"، وتُستخدم قوة العصبون في الشبكات العصبية النادرة كمعيار لقياس أهمية الميزة. ويُدمج هذا المعيار مع مُفكِّكات تفتيت مُتعددة الاتصالات النادرة (sparsely connected denoising autoencoders) التي تم تدريبها باستخدام عملية التدريب التطوري النادر (sparse evolutionary training)، مما يُنتج قياسًا لقيمة جميع الميزات المدخلة في آنٍ واحد. وقد تم تنفيذ QuickSelection بطريقة نادرة تمامًا، على عكس النهج الشائع الذي يستخدم قناعًا ثنائيًا (binary mask) على الروابط لمحاكاة الندرة. ويؤدي هذا إلى زيادة كبيرة في السرعة وتقليل كبير في استخدام الذاكرة. عند اختبارها على عدة مجموعات بيانات معيارية، بما في ذلك خمس مجموعات منخفضة الأبعاد وثلاث مجموعات عالية الأبعاد، تمكّنت الطريقة المقترحة من تحقيق أفضل توازن بين دقة التصنيف والترميز التجميعي، ووقت التشغيل، واستخدام الذاكرة القصوى، مقارنةً بالطرق الشائعة لاختيار الميزات. علاوةً على ذلك، فإن الطريقة المقترحة تستهلك أقل كمية طاقة ممكنة مقارنةً بطرق اختيار الميزات القائمة على المُفكِّكات التلقائية (autoencoder-based) في الحالة الراهنة.