HyperAIHyperAI

Command Palette

Search for a command to run...

بيئة التعلم في نت هاك

Heinrich Küttler Nantas Nardelli Alexander H. Miller Roberta Raileanu Marco Selvatici Edward Grefenstette Tim Rocktäschel

الملخص

تقدم خوارزميات التعلم التعزيزي (RL) يسير جنبًا إلى جنب مع تطوير بيئات تحدي صعبة تختبر حدود الطرق الحالية. بينما تكون البيئات الحالية للتعلم التعزيزي إما معقدة بما يكفي أو تعتمد على محاكاة سريعة، إلا أنها نادراً ما تكون كلاهما في آن واحد. في هذا السياق، نقدم بيئة التعلم NetHack (NLE)، وهي بيئة قابلة للتوسع وتوليد إجرائي وعشوائية وغنية وصعبة لبحوث التعلم التعزيزي، تستند إلى اللعبة الشهيرة NetHack التي هي لعبة Roguelike قائمة على الطرفية وموجهة للاعب الفردي. نعتقد أن NetHack معقدة بما يكفي لتحفيز البحث طويل المدى حول مشاكل مثل الاستكشاف والتخطيط وتحصيل المهارات والتعلم التعزيزي المشروط باللغة، بينما تقلل بشكل كبير من الموارد الحاسوبية المطلوبة لجمع كمية كبيرة من الخبرات. نقارن بين NLE ومجموعة مهامها وبين البديلات الموجودة، ونناقش أسباب كونها الوسيط المثالي لاختبار متانة وكالات التعلم التعزيزي وتعميمها النظامي. نظهر النجاح التجريبي للأطوار الأولى من اللعبة باستخدام أساس موزع للتعلم العميق التعزيزي واستكشاف تقطير الشبكة العشوائية، بالإضافة إلى تحليل نوعي لكالات مختلفة تم تدريبها في هذه البيئة. Bيئة NLE مفتوحة المصدر على الرابط https://github.com/facebookresearch/nle.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
بيئة التعلم في نت هاك | مستندات | HyperAI