HyperAIHyperAI
منذ 2 أشهر

تحدي ستارкраフト متعدد الوكلاء

Mikayel Samvelyan; Tabish Rashid; Christian Schroeder de Witt; Gregory Farquhar; Nantas Nardelli; Tim G. J. Rudner; Chia-Man Hung; Philip H. S. Torr; Jakob Foerster; Shimon Whiteson
تحدي ستارкраフト متعدد الوكلاء
الملخص

في السنوات الأخيرة، أصبح التعلم العميق المتعدد الوكلاء (RL) مجالًا بحثيًا نشطًا للغاية. من بين المشكلات الأكثر تحديًا في هذا المجال هي المشكلات التي يتم ملاحظتها جزئيًا والتعاونية والمتعددة الوكلاء، حيث يجب على فرق الوكلاء تعلم تنسيق سلوكهم معتمدين فقط على الملاحظات الخاصة بهم. يعد هذا المجال البحثي جذابًا لأنه يرتبط بعدد كبير من الأنظمة الحقيقية، كما أنه أكثر قابلية للتقييم من المشكلات ذات المجموع العام. سمحت البيئات القياسية مثل ALE و MuJoCo للتعلم المتفرد RL بالانتقال إلى ما هو أبعد من المجالات البسيطة، مثل عوالم الشبكة. ومع ذلك، لا يوجد معيار مكافئ للتعلم التعاوني المتعدد الوكلاء. نتيجة لذلك، تستخدم معظم الأوراق البحثية في هذا المجال مشكلات بسيطة غير قياسية، مما يجعل قياس التقدم الحقيقي أمرًا صعبًا. في هذه الورقة، نقترح تحدي StarCraft متعدد الوكلاء (SMAC) كمشكلة معيارية لسد هذه الفجوة. يستند SMAC إلى لعبة الاستراتيجية الزمنية الشهيرة StarCraft II ويركز على تحديات الإدارة الدقيقة حيث يتم التحكم في كل وحدة بواسطة وكيل مستقل يجب أن يعمل بناءً على الملاحظات المحلية. نقدم مجموعة متنوعة من خرائط التحدي وتوصيات لأفضل الممارسات في القياس والتقييم. كما نقوم بإتاحة مصدر رمزي لإطار عمل تعلم متعدد الوكلاء عميق يشمل الخوارزميات الرائدة. نعتقد أن SMAC يمكن أن يوفر بيئة قياسية للمعايير لمدة طويلة قادمة. يمكن مشاهدة مقاطع الفيديو لأفضل وكلائنا في عدة سيناريوهات SMAC عبر الرابط: https://youtu.be/VZ7zmQ_obZ0.注释:- "ALE" 和 "MuJoCo" 是常见的科技术语,因此直接使用了它们的英文缩写。- "StarCraft Multi-Agent Challenge (SMAC)" 作为一个特定的研究项目名称,保留了其英文缩写以确保信息完整性和专业性。

تحدي ستارкраフト متعدد الوكلاء | أحدث الأوراق البحثية | HyperAI