بحث فعّال عالميًا في بنية الشبكة العصبية

أظهرت بحوث بحث البنية العصبية (NAS) إمكانات كبيرة في أتمتة تصميم الشبكات العصبية لمهام محددة، لكنها تتطلب موارد حسابية كبيرة نظرًا لتكاليف التدريب المرتبطة بتقييم عدد كبير من البنية للعثور على الأفضل. ولتسريع عملية NAS، ركزت الدراسات الحديثة على تقييد البحث إلى وحدات بناء الشبكة (البحث الموديولي) بدلًا من البحث في البنية الكاملة (البحث العالمي)، وتم تقييم أداء المرشحين تقريبًا بدلاً من التدريب الكامل، واستُخدمت خوارزمية الانحدار التدريجي بدلًا من الطرق المثالية للتحسين المتقطع. ومع ذلك، فإن البحث الموديولي لا يحدد البنية ماكرو للشبكة، أي العمق والعرض، مما يتطلب تجربة يدوية وخطأ بعد البحث، وبالتالي يفتقر إلى الأتمتة الكاملة. في هذا العمل، نعيد النظر في NAS ونصمم فضاء بحث ماكرو-مايكرو قابلاً للتنقل، مع تنوع معماري كبير. بالإضافة إلى ذلك، تستخدم الطرق الحالية تقريبات ثابتة عبر فضاء البحث بأكمله لتقييم الترتيب النسبي للمرشحين، في حين أن الشبكات المختلفة قد لا تكون قابلة للمقارنة بشكل عادل ضمن بروتوكول تدريب واحد. لذلك، نقترح تقريبًا يراعي البنية مع استخدام خطط تدريب مختلفة لكل شبكة. علاوة على ذلك، نطور استراتيجية بحث فعالة من خلال فصل تصميم الشبكة ماكرو-مايكرو، مما ينتج بنى شبكية تنافسية من حيث الدقة والحجم. تحقق الإطار المقترح أداءً جديدًا على مستوى الأفضل في مجموعتي بيانات EMNIST وKMNIST، مع أداء تنافسي جيد على مجموعات CIFAR-10 وCIFAR-100 وFashionMNIST، وبنفس الوقت تكون أسرع بمقدار 2 إلى 4 مرات مقارنة بأسرع الطرق العالمية للبحث. وأخيرًا، نُظهر قابلية نقل إطارنا إلى مشكلات حقيقية في رؤية الحاسوب من خلال اكتشاف بنى شبكية تنافسية لتطبيقات التعرف على الوجوه.