Command Palette
Search for a command to run...
بيئة التعلم أركيد: منصة تقييم للوكلاء العامين
بيئة التعلم أركيد: منصة تقييم للوكلاء العامين
Marc G. Bellemare Yavar Naddaf Joel Veness Michael Bowling
الملخص
في هذا المقال، نقدم بيئة التعلم أركيد (ALE): وهي مشكلة تحدي و منصة ومنهجية لتقييم تطور التقنية الذكية الاصطناعية العامة والمستقلة عن المجال. توفر ALE واجهة لآلاف بيئات ألعاب آتاري 2600، وكل واحدة منها مختلفة ومثيرة ومصممة لتكون تحديًا لللاعبين البشريين. تقدم ALE تحديات بحثية كبيرة في مجالات التعلم التعزيزي، تعلم النماذج، التخطيط القائم على النموذج، التعلم التقليدي، التعلم بالنقل، والتحفيز الداخلي. وأهم من ذلك أنها توفر مختبرًا دقيقًا لتقييم ومقارنة الأساليب الموجهة لهذه المشكلات. نوضح إمكانات ALE من خلال تطوير وتقييم عملاء مستقلين عن المجال تم تصميمهما باستخدام تقنيات ذكاء اصطناعي معروفة جيدًا لكل من التعلم التعزيزي والتخطيط. وفي هذا السياق، نقترح أيضًا منهجية تقييم ممكنة بفضل ALE، حيث نقدم نتائج تجريبية لأكثر من 55 لعبة مختلفة. جميع البرمجيات، بما في ذلك العملاء المرجعيين (benchmark agents)، متاحة للعامة.