تطوّر البنية العصبية باستخدام نموذج واحد فقط

يُعدّ بحث البنية العصبية (Neural Architecture Search - NAS) اتجاهًا بحثيًا جديدًا يمتلك القدرة على استبدال البنى العصبية المُصممة يدويًا والمخصصة للمهام المحددة. ويعتمد البحث السابق القائم على التطور على موارد حوسبة عالية، مما يؤدي إلى زمن بحث طويل. في هذا العمل، نقترح طريقة جديدة لتطبيق خوارزمية جينية بسيطة على مشكلة NAS تُعرف بـ EvNAS (Evolving Neural Architecture using One Shot Model)، والتي تقلل بشكل كبير من زمن البحث مع الحفاظ على أداء أفضل مقارنة بالأساليب السابقة القائمة على التطور. تُمثّل البنى باستخدام معلمات البنية الخاصة بنموذج "واحد فقط" (One Shot Model)، مما يُتيح مشاركة الأوزان بين البنى المختلفة ضمن مجموعة معينة من البنية، كما يُمكن توريث الأوزان من جيل إلى الجيل التالي. نقترح تقنية فك تشفير (decoding) لمعالم البنية، تُستخدم لتوجيه معظم معلومات التدرج نحو البنية المعطاة، كما تُستخدم لتحسين توقع الأداء للبنية المحددة من خلال نموذج "واحد فقط" أثناء عملية البحث. علاوة على ذلك، نستخدم دقة البنية الجزئية التدريب على بيانات التحقق كتقدير لملاءمتها (fitness)، بهدف تقليل زمن البحث. يبحث EvNAS عن البنية على مجموعة بيانات بديلة (proxy dataset) وهي CIFAR-10، باستخدام 4.4 يوم من وحدة معالجة الرسومات (GPU) على وحدة معالجة واحدة، ويحقق خطأًا في الاختبار بنسبة 2.47% في التصنيف الأولي (top-1) مع 3.63 مليون معلمة، ثم يُنقل إلى CIFAR-100 وImageNet، حيث يحقق خطأً بنسبة 16.37% في التصنيف الأولي و7.4% في التصنيف الخامس (top-5) على التوالي. تُظهر جميع هذه النتائج الإمكانات الكبيرة للطرق التطورية في حل مشكلة بحث البنية العصبية.