HyperAI

الذكاء الاصطناعي لعائلة هو سان موجود هنا

特色图像

أطلقت شركة مايكروسوفت نموذج الذكاء الاصطناعي للعبة الماهجونغ، والذي نجح في الوصول إلى أعلى مستوى على منصة تنافسية احترافية. في هذا النشاط الترفيهي الذي يحظى بشعبية كبيرة في جميع أنحاء البلاد وحتى العالم، ما هي الصعوبات التي تغلب عليها ميلاد AI Mahjong God، وما هو المعنى الأعمق لميلاد هذه التكنولوجيا؟

في مؤتمر الذكاء الاصطناعي العالمي الذي عقد مؤخرًا، أطلقت شركة مايكروسوفت لعبة "AI Mahjong God" - Suphx، والتي تجاوزت المستوى المتوسط لأفضل اللاعبين البشريين على منصة المنافسة الاحترافية في لعبة Mahjong.

تم إطلاق لعبة Suphx، واسمها الكامل هو Super Phoenix، على منصة المنافسة الاحترافية للعبة الماهجونغ في اليابان "Tenho" في مارس 2019.

قدم هاري شوم، نائب الرئيس التنفيذي العالمي لشركة مايكروسوفت، Suphx في الموقع

على منصة الماهجونغ الأكثر شهرة هذه، في المنافسة المفتوحة "الغرفة الخاصة" حيث يمكن للذكاء الاصطناعي المشاركة، لعب Suphx أكثر من 5000 لعبة ماهجونغ لأربعة لاعبين مع لاعبين بشريين، وأظهر تدريجيًا قوته ومستواه.

بحلول شهر يونيو، وصل Suphx إلى أعلى رتبة في الغرفة الخاصة، الرتبة العاشرة. ما منع Suphx من الوصول إلى المرتبة الحادية عشرة، "رتبة Tianfeng"، هو أن المنصة لم تسمح لنظام الذكاء الاصطناعي بالدخول إلى الغرفة ذات المستوى الأعلى للمعارك.

منذ إطلاق منصة Tianfeng في عام 2006، كان هناك ما يقرب من 180 لاعبًا وصلوا إلى المستوى العاشر في لعبة الماهجونغ المكونة من أربعة لاعبين، في حين لا يوجد سوى اثني عشر لاعبًا بشريًا نشطًا في المستوى العاشر. ولكن من حيث الرتبة المستقرة، التي تقيس مستوى القوة، وصل Suphx إلى 8.7، وهو أعلى بكثير من 7.4 الذي حققه اللاعب البشري من المستوى العاشر.

Suphx هو أعلى مستوى بين جميع الذكاء الاصطناعي على منصة Tianfeng

في السابق، كان هناك نظامان آخران للذكاء الاصطناعي في لعبة الماهجونغ نشطان على منصة Tianfeng، وهما "Blast" الذي أصدرته جامعة طوكيو في عام 2015، و"NAGA25" الذي أصدرته Dwango في عام 2018، ولكن التصنيف المستقر لكليهما كان أقل من 6.5، وكانا بعيدًا عن Suphx.

ماجونغ بتاريخ يمتد لألف عام: نشاط ترفيهي شعبي يتطور ببطء

ماجونغ، المعروفة أيضًا باسم "ماجونغ" أو "بطاقات العصفور"، هي لعبة صينية أصلية.

هناك العديد من القصص المختلفة حول أصل لعبة الماهجونغ، ومن المستحيل التحقق من الحقيقة، ولكن ما هو مؤكد هو أنه منذ ظهورها، أصبحت لعبة الماهجونغ شائعة بين الناس كمشروع ترفيهي وطني وظلت شائعة لفترة طويلة.

يمكن إرجاع أصل لعبة الماهجونغ إلى البطاقات ذات الشكل الورقي في عهد أسرة هان.

لقد خضعت رموز وإنتاج بلاط الماهجونغ أيضًا للعديد من التغييرات. أقدم بلاط الماهجونغالخيزران وعظام الحيواناتالإنتاج، وكانت هناك أيضًا فترة لعب الورق بعد ذلك.

ومن بين كبار الشخصيات، تم استخدام قرون وحيد القرن، والعاج، والذهب، والفضة، والنحاس، والخزف الأزرق والأبيض لصنع بلاط الماهجونغ. في ذلك الوقت، كان يتم نحت بلاط الماهجونغ واحدًا تلو الآخر بواسطة الحرفيين المهرة.

أطلقت العلامات التجارية العالمية مثل LV وPrada وHermès ألعاب ماجونغ مخصصة وعالية الجودة.

ولم يكن من الممكن إنتاج الماهجونغ كمادة بكميات كبيرة إلا بعد عام 1960 مع انتشار المنتجات البلاستيكية وتطور الميكنة.

ولكن بصرف النظر عن التغيرات في تقنيات الإنتاج، فإن التكنولوجيا الأكثر تقدمًا في لعبة الماهجونغ، إلى جانب الذكاء الاصطناعي، قد تكون آلة الماهجونغ الأوتوماتيكية.

الذكاء الاصطناعي يفوز بالمنطق

قبل أبحاث الذكاء الاصطناعي، كان الكثير من الناس يعتقدون أن الحظ هو العامل الحاسم في لعبة الماهجونغ. لكن في الواقع، فإن قواعد المنافسة في لعبة الماهجونغ هي في الواقع قضايا معقدة للغاية.

136 بلاطة ماجونغهناك العديد من النتائج المحتملة للتباديل والتركيباتبين لعبتين للبطاقة من قبل نفس اللاعب، هناك لعبات من قبل اللاعبين الثلاثة الآخرين، بالإضافة إلى سحب البطاقة الخاصة به. بالإضافة إلى ذلك، فإن "تشي" و"بنج" و"جانج" سوف تسبب تغييرات ديناميكية في اللعبة.

ثانياً، هذا هومشكلة المعلومات غير الكاملة. كل لاعب يعرف فقط بطاقاته الـ13 والبطاقات التي تم لعبها، في حين أن بطاقات الأشخاص الآخرين والبطاقات المخفية المتبقية غير معروفة. هذه المعلومات المخفية تؤدي إلى العديد من المتغيرات.

مقارنة تعقيد العديد من ألعاب الورق

حتى بالنسبة للاعبين ذوي الخبرة، من الصعبتوضيح العلاقة المنطقية بين البطاقات المعروفة وأفضل طريقة للعب, المعلومات المخفية الغنية سوف تزيد من تعقيد اللعبة.

ويتطلب هذا تخطيطًا استراتيجيًا جيدًا طوال العملية. على سبيل المثال، عندما يكون الوضع غير موات، قم استراتيجيًا بـ "السماح للاعب الرابع بالفوز" لمنع تجاوزه من قبل صاحب المركز الثاني في النتيجة الإجمالية.

لذلك، إذا كنت تريد بناء ذكاء اصطناعي متخصص في لعبة Mahjong، فإن قوة الحوسبة القوية وحدها لا تكفي. ما هو مطلوب أكثر هو جعل الذكاء الاصطناعي يمتلكالحدس والتنبؤ والاستدلالواتخاذ القرارات الغامضةقدرة.

كيف تصبح لاعب ماهجونغ عظيمًا من خلال التعلم التعزيزي العميق

ولمعالجة الصعوبات المذكورة أعلاه، استخدمت مايكروسوفت التعلم التعزيزي العميق لإنشاء Suphx، الذي أصبح تدريجيًا، من خلال أحدث الخوارزميات، أقوى لاعب ماجونغ في لعبة ماجونغ التنافسية من خلال التعلم والتصحيح.

هكذا فعل Suphx ذلك

المرحلة الأولى هي مرحلة "التهيئة". باستخدام البيانات العامة لمنصة "تيانفينج"، تمكن الباحثونالتعلم الخاضع للإشرافاحصل على نموذج أولي، واستنادًا إلى النموذج، استخدم اللعبة الذاتية لإجراء تدريب التعلم التعزيزي.

وبعد ذلك، بالنسبة للعبة المعلومات غير الكاملةولمواجهة هذا التحدي، قامت Suphx بتجربة تقنية التدريب النبي بشكل مبتكر لتحسين تأثير التعلم التعزيزي.

خلال مرحلة التدريب، يتم استخدام المعلومات المخفية غير المرئية لتوجيه اتجاه تدريب نموذج الذكاء الاصطناعي، مما يجعل مسار التعلم الخاص به أكثر وضوحًا وأقرب إلى المسار الأمثل من حيث المعلومات المثالية، وبالتالي دفع نموذج الذكاء الاصطناعي إلى فهم المعلومات المرئية بشكل عميق وإيجاد استراتيجيات فعالة منها.

إن هيكل شجرة البحث الكلاسيكي، حيث تأمل الذكاء الاصطناعي في تقليل الحد الأقصى لمكسب الخصم، غير مناسب لألعاب Mahjong.

بالإضافة إلى ذلك، بالنسبة لتعبير بطاقة الماهجونغ المعقدة وآلية التسجيل، فإنهم يستخدمون تكنولوجيا التنبؤ الشاملة لبناء جسر بين كل جولة من المنافسة والنتيجة النهائية بعد 8 جولات.

من خلال التصميم المبتكرالمتنبئيمكن للنموذج فهم تأثير كل جولة من الألعاب على النتيجة النهائية، وبالتاليمنظور صنع القرار العالمي.

كما قدم فريق البحث آلية جديدة يمكنها التحكم بشكل ديناميكي في مسار اللعبة، مما يسمح لـ Suphx بتعديل استراتيجيته استنادًا إلى أحدث المعلومات أثناء مرحلة التفكير واتخاذ قرارات تكيفية.

الخطوة الأخيرة هي الدخول في القتال الفعلي، من خلال المشاركة المستمرة في الألعاب التي يلعبها اللاعبون البشريون، مما يسمح للذكاء الاصطناعي بالتعلم المستمر وتحسين مهاراته.

في هذه الجولة، لم يفز Suphx باللعبة فحسب، بل فاز أيضًا بالثلاثة الكبار.

منذ دخول منصة Tianfeng في شهر مارس، كان Suphx يتطور باستمرار. في الوقت الحالي، أصبح Suphx قادرًا على تحقيق استراتيجيات أكثر ذكاءً من أفضل اللاعبين البشريين في تحقيق التوازن بين الهجوم والدفاع، وإكمال التوازن الاستراتيجي بين الخسائر قصيرة الأجل والمكاسب طويلة الأجل، واتخاذ قرارات سريعة بناءً على المعلومات الغامضة المتاحة.

الذكاء الاصطناعي في لعبة ماجونغ: أكثر من مجرد الفوز أو الخسارة على الطاولة

بفضل خوارزميتها الجديدة وتقنيات التدريب، تعد Suphx فريدة من نوعها في طريقة وأسلوب اللعب.

أشاد أفضل لاعب بشري على منصة Tianfeng بـ Suphx على وسائل التواصل الاجتماعي. شعر أنه شاهد العديد من ألعاب Suphx وتعلم الكثير من التقنيات التي لم يرها من قبل.

بالإضافة إلى ذلك، قال العديد من اللاعبين أنهم تعلموا مهارات القتال العملية من اللعب ضد Suphx، ولذلك أطلقوا عليه لقب "كتاب ماجونغ" و"معلم Suphx".

التنوير التقني الذي جلبته لعبة الماهجونغ المكونة من 136 قطعة

عندما يتعلق الأمر بالفوز أو الخسارة في لعبة الماهجونغ، يستمتع الأشخاص العاديون بإثارة الحظ والخبرة، بينما يستمتع المحترفون بمسابقة الذكاء.

إن الذكاء الاصطناعي "إله الماهجونغ" هذا، بالإضافة إلى إنشاء مدرب ماهجونغ لا يقهر، يمكنه أيضًا فتح آفاق جديدة، مما يسمح لنا بتحليل هذا الترفيه من بُعد خوارزميات البيانات.

لم يعد يعتمد على الحظ مثل المقامر، ولكن تحت هالة قوة العقل، يتخلى تدريجيا عن تلك الأشياء العشوائية وغير المؤكدة ويستكشف مجموعة من القواعد لتحقيق النصر.

أليس هذا هو شعاع الضوء الأكثر إثارة للاهتمام على طريق تطوير الذكاء الاصطناعي؟

مرجع المحتوى: عنوان بحث مايكروسوفت للذكاء الاصطناعي "Microsoft Super Mahjong AI Suphx، حل ألعاب المعلومات غير الكاملة" (https://mp.weixin.qq.com/s/S-axCx41WKDJG2BiGGTZfg)