بحث في هندسة الشبكات العصبية باستخدام التعلم التعزيزي

الشبكات العصبية هي نماذج قوية ومرونة تحقق أداءً جيدًا في العديد من المهام الصعبة المتعلقة بفهم الصور والكلام واللغة الطبيعية. على الرغم من نجاحها، لا تزال الشبكات العصبية صعبة التصميم. في هذا البحث، استخدمنا شبكة متكررة لتوليد وصف النماذج للشبكات العصبية وتدربنا على هذه الشبكة المتكررة باستخدام التعلم التعزيزي لتعظيم الدقة المتوقعة للهياكل المُولدة على مجموعة التحقق. بالنسبة لمجموعة بيانات CIFAR-10، يمكن لطريقتنا، بدءًا من الصفر، تصميم هيكل شبكة عصبية جديد ينافس أفضل الهياكل التي ابتكرها البشر من حيث دقة مجموعة الاختبار. حققت شبكتنا على CIFAR-10 معدل خطأ في الاختبار بلغ 3.65، وهو أفضل بنسبة 0.09 بالمائة وأسرع بمقدار 1.05 مرة من أفضل النموذج السابق الذي استخدم مخططًا معماريًا مشابهًا. بالنسبة لمجموعة بيانات Penn Treebank، يمكن لنموذجنا تركيب خلية متكررة جديدة تتفوق على الخلية LSTM الشائعة الاستخدام وغيرها من النماذج الأساسية الأكثر تقدمًا. حققت خليتنا معدل حيرة (perplexity) بلغ 62.4 على Penn Treebank، وهو أفضل بمقدار 3.6 حيرة من أفضل النموذج السابق. يمكن أيضًا نقل الخلية إلى مهمة نمذجة اللغة الحرفية على Penn Treebank وتحقيق أداء حيرة (perplexity) يبلغ 1.214، وهو الأفضل حتى الآن.请注意,这里的“حيرة”(perplexity)是一个专有名词,用于衡量模型在预测序列中的不确定性。为了保持专业性和信息完整性,我在第一次出现时保留了英文原词“perplexity”。