HyperAIHyperAI
منذ 18 أيام

البحث المعماري العصبي المُوجَّه بلوكياً مع التعلم المُوجَّه بالمعرفة

Changlin Li, Jiefeng Peng, Liuchun Yuan, Guangrun Wang, Xiaodan Liang, Liang Lin, Xiaojun Chang
البحث المعماري العصبي المُوجَّه بلوكياً مع التعلم المُوجَّه بالمعرفة
الملخص

يُعدّ بحث البنية العصبية (NAS) هدفًا يسعى إلى تصميم هياكل الشبكات تلقائيًا بواسطة الآلات، ويتوقع منه أن يُحدث ثورة جديدة في تعلم الآلة. وعلى الرغم من هذه التوقعات العالية، تبقى فعالية وفعالية الحلول الحالية لـ NAS غير واضحة، حيث ذكرت بعض الدراسات الحديثة أن العديد من حلول NAS الحالية لا تتفوق على اختيار الهياكل عشوائيًا. وقد يُعزى عدم كفاءة حلول NAS إلى تقييم غير دقيق للهياكل. وبالتحديد، لتسريع عملية NAS، اقترح العديد من الدراسات الحديثة تدريبًا مُختصرًا للهياكل المرشحة المختلفة بشكل متزامن ضمن فضاء بحث واسع باستخدام معاملات شبكة مشتركة؛ لكن هذا أدى إلى تصنيف خاطئ للهياكل، مما زاد من ضعف فعالية NAS.في هذا العمل، نقترح تفكيك فضاء البحث الكبير في NAS إلى كتل (Blocks) لضمان تدريب كامل للهياكل المرشحة المحتملة؛ مما يقلل من الانزياح التمثيلي الناتج عن استخدام المعاملات المشتركة، ويؤدي إلى تصنيف دقيق للهياكل المرشحة. وبفضل البحث على مستوى الكتل، يمكننا أيضًا تقييم جميع الهياكل المرشحة ضمن كل كتلة. علاوة على ذلك، نلاحظ أن المعرفة المحتواة في نموذج الشبكة لا تكمن فقط في معاملات الشبكة، بل أيضًا في بنية الشبكة نفسها. لذلك، نقترح استخلاص معرفة البنية العصبية (DNA) من نموذج مُدرّس (Teacher Model) كإشراف لقيادة عملية البحث المُنَظَّمة على مستوى الكتل، مما يُحسّن بشكل كبير فعالية NAS. ومن الملاحظ بشكل ملحوظ أن قدرة البنية التي تم اكتشافها تفوق قدرة النموذج المُدرّس، مما يُظهر مصداقية وقابلية توسيع طريقة البحث المقترحة. وأخيرًا، تحقق طريقة البحث لدينا دقة قصوى بلغت 78.4% في تصنيف الصور (Top-1 Accuracy) على مجموعة بيانات ImageNet في بيئة الموبايل، أي بزيادة قدرها حوالي 2.1% مقارنةً بنموذج EfficientNet-B0. وجميع النماذج التي تم اكتشافها مع رمز التقييم متوفرة إلكترونيًا.