الملخص

في السنوات الأخيرة، أصبح التعلم العميق المتعدد الوكلاء (RL) مجالًا بحثيًا نشطًا للغاية. من بين المشكلات الأكثر تحديًا في هذا المجال هي المشكلات التي يتم ملاحظتها جزئيًا والتعاونية والمتعددة الوكلاء، حيث يجب على فرق الوكلاء تعلم تنسيق سلوكهم معتمدين فقط على الملاحظات الخاصة بهم. يعد هذا المجال البحثي جذابًا لأنه يرتبط بعدد كبير من الأنظمة الحقيقية، كما أنه أكثر قابلية للتقييم من المشكلات ذات المجموع العام. سمحت البيئات القياسية مثل ALE و MuJoCo للتعلم المتفرد RL بالانتقال إلى ما هو أبعد من المجالات البسيطة، مثل عوالم الشبكة. ومع ذلك، لا يوجد معيار مكافئ للتعلم التعاوني المتعدد الوكلاء. نتيجة لذلك، تستخدم معظم الأوراق البحثية في هذا المجال مشكلات بسيطة غير قياسية، مما يجعل قياس التقدم الحقيقي أمرًا صعبًا. في هذه الورقة، نقترح تحدي StarCraft متعدد الوكلاء (SMAC) كمشكلة معيارية لسد هذه الفجوة. يستند SMAC إلى لعبة الاستراتيجية الزمنية الشهيرة StarCraft II ويركز على تحديات الإدارة الدقيقة حيث يتم التحكم في كل وحدة بواسطة وكيل مستقل يجب أن يعمل بناءً على الملاحظات المحلية. نقدم مجموعة متنوعة من خرائط التحدي وتوصيات لأفضل الممارسات في القياس والتقييم. كما نقوم بإتاحة مصدر رمزي لإطار عمل تعلم متعدد الوكلاء عميق يشمل الخوارزميات الرائدة. نعتقد أن SMAC يمكن أن يوفر بيئة قياسية للمعايير لمدة طويلة قادمة. يمكن مشاهدة مقاطع الفيديو لأفضل وكلائنا في عدة سيناريوهات SMAC عبر الرابط: https://youtu.be/VZ7zmQ_obZ0.注释：- "ALE" 和 "MuJoCo" 是常见的科技术语，因此直接使用了它们的英文缩写。- "StarCraft Multi-Agent Challenge (SMAC)" 作为一个特定的研究项目名称，保留了其英文缩写以确保信息完整性和专业性。

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Command Palette

تحدي ستارкраフト متعدد الوكلاء

Mikayel Samvelyan∗1 Tabish Rashid∗2 Christian Schroeder de Witt2 Gregory Farquhar2 Nantas Nardelli2 Tim G. J. Rudner2 Chia-Man Hung2 Philip H. S. Torr2 Jakob Foerster3 Shimon Whiteson2

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

تحدي ستارкраフト متعدد الوكلاء

Mikayel Samvelyan∗1 Tabish Rashid∗2 Christian Schroeder de Witt2 Gregory Farquhar2 Nantas Nardelli2 Tim G. J. Rudner2 Chia-Man Hung2 Philip H. S. Torr2 Jakob Foerster3 Shimon Whiteson2

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

تحدي ستارкраフト متعدد الوكلاء

Mikayel Samvelyan∗1 Tabish Rashid∗2 Christian Schroeder de Witt2 Gregory Farquhar2 Nantas Nardelli2 Tim G. J. Rudner2 Chia-Man Hung2 Philip H. S. Torr2 Jakob Foerster3 Shimon Whiteson2

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters