HyperAI

يمكن للبشر الفوز في Dota 2 لأن الذكاء الاصطناعي تم تعليمه بواسطة Blizzard

منذ 7 أعوام
معلومة
Sparanoid
特色图像
يمكن للبشر الفوز في Dota 2 لأن الذكاء الاصطناعي تم تعليمه بواسطة Blizzard

بقلم تومي تومسون

خبير أبحاث أول في مجال الذكاء الاصطناعي والألعاب

يوتيوب @TableFlipGames

مقدمة عن HyperAI

تمكن البشر أخيرًا من التغلب على الذكاء الاصطناعي في لعبة DOTA2.

دخلت اليوم مرحلة خروج المغلوب من بطولة Ti8 (بطولة DOTA2 الدولية)، الحدث الأبرز في لعبة DOTA2 على مستوى العالم، يومها الثالث. لسوء الحظ، تم إقصاء الفريق الصيني VG. أصبح فريق OpenAI Ivor vs. Pain اللاحق أحد أبرز الأحداث. على عكس المرة الأخيرة عندما هُزم OpenAI على يد Dendi، انتهى الأمر هذه المرة بفريق OpenAI Ivor بالخسارة في المباراة الأولى، وبدا أن الفريق البشري رأى القليل من الأمل مرة أخرى.

ولكن في الواقع،أوبن أيه آيعند التدريب، يستخدمون عادةً "StarCraft" التي أنتجتها شركة Blizzard، والتي كانت دائمًا كلاسيكية في قلوب العديد من اللاعبين ومكانتها لا تقل عن "World of Warcraft".

باعتبارها لعبة إستراتيجية في الوقت الفعلي، فهي تعتمد على آليات اللعبة مثل التعاون متعدد الخدمات والتخطيط الإستراتيجي الكلي لتوليد إمكانيات لا حصر لها في نفس اللعبة، وهو أمر مفيد للغاية لتدريب قدرة الذكاء الاصطناعي على اتخاذ القرار وكفاءة الخوارزمية في السيناريوهات غير المؤكدة. اليوم، أصبحت هذه اللعبة بمثابة حقل اختبار للذكاء الاصطناعي لشركات التكنولوجيا المعروفة مثل جوجل ومايكروسوفت.

ألعاب استراتيجية الوقت الحقيقي: أفضل الألعاب لتدريب الذكاء الاصطناعي

ألعاب الإستراتيجية في الوقت الحقيقي (RTS) هي نوع من ألعاب الإستراتيجية. على عكس الألعاب المعتمدة على الأدوار، يمكن لعب هذا النوع من الألعاب في الوقت الحقيقي. عادةً ما يتصرف اللاعبون كصناع قرار في اللعبة ويحتاجون إلى تنفيذ عمليات كبرى مثل نشر القوات وصياغة الاستراتيجيات. بالإضافة إلى لعبة "StarCraft"، تشمل الألعاب الأكثر شيوعًا في الوقت الفعلي "Warcraft" و"Red Alert" وما إلى ذلك.

يحتوي هذا النوع من الألعاب عمومًا على آلية الضباب، مما يعني أن جميع اللاعبين لديهم رؤية محدودة ولا يمكنهم رؤية سوى المشهد المحيط بهم. يحتاج اللاعبون إلى جمع الموارد من خلال استكشاف العالم لبناء القواعد وإنشاء أشجار التكنولوجيا (مثل تصنيع الأسلحة من خلال مواد مختلفة، وما إلى ذلك). لا يمكنهم الفوز إلا من خلال تدمير تحصينات العدو بنجاح والقضاء على الأعداء، أو مقاومة جميع الهجمات.

يمكن للبشر الفوز في Dota 2 لأن الذكاء الاصطناعي تم تعليمه بواسطة Blizzard

أثناء اللعبة، ستصبح كيفية تخصيص الموارد بشكل معقول، وصياغة خطط الهجوم والدفاع، ودرجة فهم الخريطة، العوامل الرئيسية المؤثرة على نتيجة المعركة.

وهذا يتطلب من اللاعبين ليس فقط استكشاف العالم المجهول باستمرار أثناء لعب اللعبة، بل أيضًا مراقبة حالة المعركة دائمًا وصياغة استراتيجيات هجومية ودفاعية. بالإضافة إلى ذلك، فإن مساحة البحث عن هذا النوع من الألعاب ضخمة، وقد تكون هناك احتمالات لا حصر لها في اللعبة. لذلك، تعد ألعاب استراتيجية الوقت الحقيقي مناسبة جدًا لتدريب قدرة الذكاء الاصطناعي على اتخاذ القرار في السيناريوهات غير المؤكدة واختبار كفاءة خوارزميات الذكاء الاصطناعي.

يبدأ تدريب الذكاء الاصطناعي بغزو StarCraft

من بين جميع ألعاب استراتيجية الوقت الحقيقي، فإن لعبة "StarCraft" هي بلا شك الخيار الأفضل.

هذه اللعبة مشهورة ولديها عدد كبير من اللاعبين، مما يمكن أن يوفر كمية كبيرة من بيانات اللاعب البشري اللازمة لتدريب الذكاء الاصطناعي. علاوة على ذلك، هذه اللعبة معقدة للغاية ويمكنها اختبار الكفاءة الخوارزمية لنموذج الذكاء الاصطناعي بشكل فعال. ولذلك، منذ مرحلة مبكرة للغاية، كان هناك باحثون يأملون في تدريب نماذج الذكاء الاصطناعي من خلال "StarCraft".

باعتبارها لعبة يتم لعبها في ظل معلومات غير كاملة، فإن نطاق الخريطة 128 × 128 في "StarCraft" يمكن أن ينشئ مساحة بحث ضخمة. حاليًا، تبلغ مساحة البحث عن لعبة Go حوالي 10170، ويمكن أن تصل مساحة البحث عن لعبة StarCraft إلى 101685. كما تسمح بإنشاء ما يصل إلى 400 وحدة عسكرية. يتمتع كل نوع من الوحدات العسكرية بخصائص مختلفة، مما قد يخلق احتمالات لا حصر لها في اللعبة. لذلك، تحتاج الذكاء الاصطناعي إلى تشغيل المزيد من الخوارزميات للتعامل معها.

يمكن للبشر الفوز في Dota 2 لأن الذكاء الاصطناعي تم تعليمه بواسطة Blizzard

ستار كرافت 2017 ريماستر

بالإضافة إلى ذلك، يمكن للاعبين من معسكرات مختلفة في اللعبة الالتقاء في أي وقت، مما يتطلب من الذكاء الاصطناعي الرد في غضون مللي ثانية. ويتطلب هذا أن تتمتع الذكاء الاصطناعي بالقدرة على تذكر المعلومات وتحليلها في الوقت الفعلي، وأن تكون قادرة على دمج جميع اللقاءات العشوائية أو المواقف المكتشفة، وتعديل استراتيجيات اللعبة بشكل مستمر. علاوة على ذلك، وباعتبارها مشهدًا افتراضيًا، فإن تكلفة التجربة والخطأ في التدريب منخفضة جدًا. تجعل هذه العوامل من StarCraft مكانًا مثاليًا لتدريب الذكاء الاصطناعي.

كيف يتعلم الذكاء الاصطناعي؟

أورتس:

منصة معركة استراتيجية الوقت الحقيقي مصممة خصيصًا لأبحاث الذكاء الاصطناعي

ORTS تعني Open Real Time Strategy (استراتيجية الوقت الحقيقي المفتوحة)، وهي عبارة عن منصة ألعاب إستراتيجية في الوقت الحقيقي مع واجهة برمجة تطبيقات RTS مفتوحة. تم تطويره في عام 2003 من قبل مايكل بورو، أستاذ علوم الكمبيوتر في جامعة ألبرتا في كندا، خصيصًا لتدريب نماذج الذكاء الاصطناعي على ألعاب الاستراتيجية في الوقت الحقيقي (RTS).

يمكن لمنصة الألعاب الاستراتيجية ثلاثية الأبعاد هذه المزودة بواجهة برمجة تطبيقات OpenGL تقليد معظم ألعاب الإستراتيجية في الوقت الفعلي الموجودة في السوق ويمكنها أيضًا معالجة الرسومات ثلاثية الأبعاد. بروتوكولات الاتصال ورمز المصدر الخاصة بـ ORTS كلها مفتوحة للجمهور. يمكن للمستخدمين الوصول إلى عدد كبير من الخرائط والنماذج والبيانات العسكرية وما إلى ذلك مجانًا، وإنشاء وحدات تحكم الذكاء الاصطناعي عن بُعد لتدريب نماذج الذكاء الاصطناعي.

يمكن للبشر الفوز في Dota 2 لأن الذكاء الاصطناعي تم تعليمه بواسطة Blizzard

يمكن الاطلاع على منصة Open Real-Time Strategy Game (ORTS) على GitHubطلب

احصل على الرابط:https://github.com/benoit-dumas/OpenRTS

تخلق ORTS الظروف للمطورين لإنشاء وحدات تحكم الذكاء الاصطناعي في ألعاب الإستراتيجية في الوقت الفعلي، لكنها لا تستطيع إلا تكرار آلية التشغيل الخاصة بألعاب RTS الموجودة ولا تزال غير قادرة على الاتصال بشكل مباشر بالألعاب الأصلية. نظرًا لوجود عدد قليل جدًا من اللاعبين البشريين المشاركين، فإن ORTS لا يحتوي إلا على لاعبين من الذكاء الاصطناعي في معظم الأوقات.

وأخيرًا، اتخذت القصة منعطفًا نحو الأفضل في عام 2009. توصلت ORTS إلى اتفاق مع Blizzard وأصدرت واجهة برمجة التطبيقات، BWAPI (واجهة برمجة التطبيقات الرسمية لـ "StarCraft: Brood War")، في آخر مسابقة RTS AI التي عقدتها ORTS. كانت هذه أيضًا أول واجهة برمجة تطبيقات خارجية للذكاء الاصطناعي في سلسلة "StarCraft".

بوابي:

يمكنك إنشاء شخصيات الذكاء الاصطناعي مباشرةً في "StarCraft"

BWAPI هو إطار عمل C++ مفتوح المصدر، مما يعني أن جميع المطورين يمكنهم تدريب نماذج الذكاء الاصطناعي الخاصة بهم في "StarCraft". يمكن لـ BWAPI توفير نماذج الذكاء الاصطناعي مع بيانات اللعبة للاعبين البشريين، بالإضافة إلى معلومات مثل حالة اللعبة الحالية وأنواع القوات المتاحة وحالة شجرة التكنولوجيا.

في المعركة، من أجل منع لاعبي الذكاء الاصطناعي من الغش، ينص النظام على أنه فقط عندما لا يكون اللاعب العدو مسدودًا بالضباب ويكون ضمن مجال رؤية نموذج الذكاء الاصطناعي، يمكن الحصول على موقع الخصم وسماته والمعلومات الأخرى.

ومع ذلك، يمكن للذكاء الاصطناعي تنفيذ إجراءات أكثر من اللاعب البشري في نفس الإطار المحدد. نتيجة لذلك، قد تواجه بعض السلوكيات الغريبة أثناء اللعب، مثل جنود الأرض الذين يمشون على الجدران، والمباني التي تنزلق حولها.

على الرغم من أن BWAPI لا يزال يعاني من عيوب في التطبيق الفعلي، فمن غير الممكن إنكار أنه نجح في تحقيق فكرة تدريب نماذج الذكاء الاصطناعي في "StarCraft" وتعزيز تطوير الذكاء الاصطناعي. كما أرسى الأساس لمسابقة "StarCraft" التي نظمتها لاحقًا AIIDE (مؤتمر الذكاء الاصطناعي والترفيه الرقمي التفاعلي).

أيدي:

دع المزيد من الأشخاص يشاركون في مسابقة الذكاء الاصطناعي "StarCraft"

في عام 2010، استضافت AIIDE، إحدى أكبر مؤتمرات أبحاث الذكاء الاصطناعي للألعاب في العالم في ذلك الوقت، أول "بطولة StarCraft AI" التي شارك فيها الذكاء الاصطناعي فقط. تنقسم المنافسة إلى 4 ألعاب في المجموع، كل منها بتركيز مختلف، وتستخدم لإظهار أداء نماذج الذكاء الاصطناعي في سيناريوهات قتالية فعلية مختلفة.

  • تركز اللعبتان الأولى والثانية على إدارة الوحدات العسكرية في التضاريس المعقدة؛

  • تستخدم اللعبة الثالثة وضع منطقة خالية من الضباب مع رؤية كاملة، ولكن الأسلحة عالية المستوى ممنوعة؛

  • اللعبة الرابعة هي مواجهة عادية، ويمكنك استخدام جنود متقدمين حتى في حالة وجود ضباب؛

وقد حققت المسابقة نجاحا كبيرا، حيث بلغ إجمالي عدد الفرق المشاركة في مجال الذكاء الاصطناعي 26 فريقا، حيث أكمل 17 فريقا منها المسابقة بأكملها. فاز بالبطولة الأولى لاعب الذكاء الاصطناعي Zerg Overmind، والذي تم تطويره من قبل فريق بحثي من جامعة كاليفورنيا.

ومن الجدير بالذكر أن مطور Overmind، الباحث الحالي في Google DeepMind أوريول فينيالس، كان في السابق بطل "StarCraft" الإسباني. على الرغم من فوز Overmind في مسابقة AIIDE، إلا أنه واجه صعوبة في هزيمة اللاعب البشري Oriol Vinyals.

في عام 2011، ومع زيادة عدد المشاركين، ولضمان عدالة المنافسة، طلبت AIIDE من لاعبي الذكاء الاصطناعي جعل الكود المصدر الخاص بهم علنيًا، وسيتم إجراء جميع المسابقات على خوادم تعتمد على بنية C/S (نموذج العميل/الخادم).

يمكن للبشر الفوز في Dota 2 لأن الذكاء الاصطناعي تم تعليمه بواسطة Blizzard

في مسابقة "StarCraft AI Competition" الثانية التي أقيمت هذا العام، فاز فريق SkyNet من المملكة المتحدة بالبطولة بفضل استراتيجيته التي ركزت على الدفاع المبكر والهجمات الدورية. تم تطوير لاعب الذكاء الاصطناعي هذا من قبل المهندس البريطاني أندرو سميث وحده، مما يثبت جدوى خوارزميات الذكاء الاصطناعي في صياغة الاستراتيجية.

بحلول عام 2012، نجحت مسابقة AIIDE في تحقيق التخزين الدائم لتسجيلات الألعاب، وهو ما يعني أن الذكاء الاصطناعي يمكنه التعلم من خلال مشاهدة الألعاب السابقة. واليوم، تواصل AIIDE تنظيم مسابقة "StarCraft" للذكاء الاصطناعي، على أمل تشجيع المزيد من الأشخاص على المشاركة في تطوير نماذج الذكاء الاصطناعي "StarCraft" لتعزيز تطوير الذكاء الاصطناعي.

عندما عقدت AIIDE مسابقتها الثانية في عام 2011، بدأت أيضًا بهدوء مسابقة أخرى لـ "StarCraft" AI مخصصة للاعبي الذكاء الاصطناعي الهواة مثل طلاب الجامعات.

سسيت:

مصممة للطلاب واللاعبين الهواة

تأسست مسابقة SSCAIT (مسابقة StarCraft للطلاب للذكاء الاصطناعي) في عام 2011 على يد ميشال سيرتيكي، وهو طالب دكتوراه سلوفاكي في الفلسفة. إنها مخصصة بشكل أساسي لطلاب الجامعات وطلاب الدراسات العليا وجميع اللاعبين في المجتمع المهتمين بمسابقة StarCraft AI.

من خلال BWAPI، يمكن لأي شخص تقريبًا تطوير وحدة التحكم بالذكاء الاصطناعي بين النجوم الخاصة به.

تعتبر بطولة SSCAIT أكثر انفتاحًا من بطولة AIIDE، كما تغير نظام المنافسة أيضًا، ويمكن مشاهدة المباريات التدريبية والمنافسة الرئيسية مباشرة على Twitch. تعتمد اللعبة على القتال القريب 1 ضد 1. عندما يتم تدمير مباني أحد الجانبين بالكامل، أو يتعطل البرنامج ويصبح غير قادر على اتخاذ قرار، سيتم إقصاء الفريق.

على الرغم من أن الذكاء الاصطناعي يواصل التحسن في منافسة "StarCraft" ويؤدي بشكل أفضل من البشر في العديد من الألعاب الأخرى، إلا أنه حتى الآن، لا يزال البشر قادرين على التغلب على الذكاء الاصطناعي في معركة الإنسان والآلة في "StarCraft".

في معركة الإنسان والآلة، لا يزال البشر يتمتعون بميزة طفيفة

أقامت منظمة AIIDE مسابقة بين الذكاء الاصطناعي واللاعبين البشر، حيث واجه اللاعبون الثلاثة الأوائل في مسابقة الذكاء الاصطناعي "StarCraft" لعام 2015 اللاعب الروسي المحترف Djem5 في "StarCraft"، ولكن لم يفز أي منهما.

وفي عام 2017، نظمت جامعة سيجونغ في سيول بكوريا الجنوبية أيضًا مسابقة بين الإنسان والآلة، حيث واجه أربعة لاعبين من الذكاء الاصطناعي سونغ بيونغ جو، وهو لاعب كوري محترف في لعبة "ستار كرافت" وأحد أقوى اللاعبين المحترفين في العالم.

وكان اللاعبون الأربعة في مجال الذكاء الاصطناعي هم MJ Bot وZZZKBot وtscmoo من جامعة سيجونغ وCherryPi من مختبر الذكاء الاصطناعي في فيسبوك. تم هزيمة جميع لاعبي الذكاء الاصطناعي الأربعة في غضون 27 دقيقة (الأسرع كان أربع دقائق ونصف).

ولذلك، بعد إنشاء Alpha Go، وجه فريق DeepMind في Google AI Lab أنظاره إلى "StarCraft"، على أمل هزيمة البشر مرة أخرى.

أطلقت Google DeepMind واجهة برمجة التطبيقات الرسمية لـ StarCraft 2

في أغسطس 2017، أعلنت DeepMind رسميًا عن شراكتها مع Blizzard لإطلاق واجهة برمجة التطبيقات الرسمية للذكاء الاصطناعي لـ "StarCraft II" - SC2LE (تُرجمت إلى: بيئة أبحاث الذكاء الاصطناعي في StarCraft 2).

هذه مجموعة أدوات مصممة للمطورين لدراسة الذكاء الاصطناعي، ولكنها تعمل فقط مع StarCraft II. مع الاحتفاظ بالعديد من ميزات BWAPI، تمت إضافة بعض الميزات الجديدة:

  • يمكنك استخدام لغة بايثون لبناء نماذج الذكاء الاصطناعي في اللعبة؛

  • يمكنك مشاهدة إعادة المباريات؛

  • يمكن تسريع تقدم اللعبة (مفيد جدًا لتدريب الذكاء الاصطناعي)؛

  • يمكن بناء خرائط مخصصة؛

  • تمت إضافة سبع ألعاب صغيرة طورتها DeepMind للاختبار الوظيفي لنماذج الذكاء الاصطناعي؛

  • من الممكن توفير المزيد من بيانات اللعبة الخاصة باللاعب البشري لنموذج الذكاء الاصطناعي.

يمكن للبشر الفوز في Dota 2 لأن الذكاء الاصطناعي تم تعليمه بواسطة Blizzard

SC2LE ميزات اللعبة الملتقطة

يتم تقسيم SC2LE إلى مجموعتين مختلفتين، واحدة مماثلة لـ BWAPI، والتي يمكنها الوصول إلى معلومات محددة ضمن إطار عمل معين. والأخرى مُجهزة خصيصًا لخوارزميات الذكاء الاصطناعي مثل التعلم الآلي، والتي يمكنها تحليل المعلومات التي تم الحصول عليها في اللعبة وتسهيل وصول الخوارزمية إلى هذه البيانات.

على الرغم من أن SC2LE يمكن أن يسمح لعدد أكبر من الأشخاص بالمشاركة في إنشاء نماذج ألعاب الذكاء الاصطناعي، إلا أنه لا يزال من الصعب على الذكاء الاصطناعي هزيمة البشر في ألعاب الإستراتيجية في الوقت الفعلي مثل "StarCraft". ومع ذلك، مع مشاركة شركات التكنولوجيا المشهورة دوليا مثل جوجل، ومايكروسوفت، وفيسبوك، قد ينقلب كل هذا.

في يونيو/حزيران من هذا العام، هزمت OpenAI، وهي منظمة غير ربحية للذكاء الاصطناعي شارك في تأسيسها إيلون ماسك والعديد من أباطرة وادي السيليكون، لاعبين بشريين محترفين في لعبة المعارك المتعددة اللاعبين في الوقت الحقيقي "DOTA 2"، وهزمت لاعبين شبه محترفين في أغسطس/آب.

تم تطوير لعبة "DOTA" استنادًا إلى محرك اللعبة "World of Warcraft III". مثل "StarCraft"، فإن "World of Warcraft" هي أيضًا لعبة إستراتيجية في الوقت الحقيقي طورتها شركة Blizzard. على الرغم من أن "DOTA 2" تم فصلها عن هذا المحرك، إلا أن بعض آليات اللعبة لا تزال محفوظة.

على الرغم من أن آليات اللعبة في "World of Warcraft" أكثر تعقيدًا ونطاق الخريطة أكبر من "DOTA 2"، إلا أن انتصار الذكاء الاصطناعي في "DOTA 2" يثبت أن الذكاء الاصطناعي قد اتخذ خطوة أخرى إلى الأمام في ألعاب الإستراتيجية في الوقت الفعلي. وفي المستقبل، ومع انضمام المزيد من شركات التكنولوجيا الكبرى، قد تخلق الذكاء الاصطناعي آليات لعب جديدة، مما يحول الألعاب التنافسية الحالية إلى معارك بين البشر والذكاء الاصطناعي.

يمكن للبشر الفوز في Dota 2 لأن الذكاء الاصطناعي تم تعليمه بواسطة Blizzard

تعال للعب جولة وراجع نقاط المعرفة اليوم