HyperAIHyperAI

Command Palette

Search for a command to run...

بحث في هندسة الشبكات العصبية باستخدام التعلم التعزيزي

Barret Zoph Quoc V. Le

الملخص

الشبكات العصبية هي نماذج قوية ومرونة تحقق أداءً جيدًا في العديد من المهام الصعبة المتعلقة بفهم الصور والكلام واللغة الطبيعية. على الرغم من نجاحها، لا تزال الشبكات العصبية صعبة التصميم. في هذا البحث، استخدمنا شبكة متكررة لتوليد وصف النماذج للشبكات العصبية وتدربنا على هذه الشبكة المتكررة باستخدام التعلم التعزيزي لتعظيم الدقة المتوقعة للهياكل المُولدة على مجموعة التحقق. بالنسبة لمجموعة بيانات CIFAR-10، يمكن لطريقتنا، بدءًا من الصفر، تصميم هيكل شبكة عصبية جديد ينافس أفضل الهياكل التي ابتكرها البشر من حيث دقة مجموعة الاختبار. حققت شبكتنا على CIFAR-10 معدل خطأ في الاختبار بلغ 3.65، وهو أفضل بنسبة 0.09 بالمائة وأسرع بمقدار 1.05 مرة من أفضل النموذج السابق الذي استخدم مخططًا معماريًا مشابهًا. بالنسبة لمجموعة بيانات Penn Treebank، يمكن لنموذجنا تركيب خلية متكررة جديدة تتفوق على الخلية LSTM الشائعة الاستخدام وغيرها من النماذج الأساسية الأكثر تقدمًا. حققت خليتنا معدل حيرة (perplexity) بلغ 62.4 على Penn Treebank، وهو أفضل بمقدار 3.6 حيرة من أفضل النموذج السابق. يمكن أيضًا نقل الخلية إلى مهمة نمذجة اللغة الحرفية على Penn Treebank وتحقيق أداء حيرة (perplexity) يبلغ 1.214، وهو الأفضل حتى الآن.请注意,这里的“حيرة”(perplexity)是一个专有名词,用于衡量模型在预测序列中的不确定性。为了保持专业性和信息完整性,我在第一次出现时保留了英文原词“perplexity”。


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp