هل ستنجو أم التنانين أم تموت؟ ما هي خوارزمية التنبؤ الأكثر دقة؟

من خلال تحليل المعلومات من المسلسل التلفزيوني الأمريكي "صراع العروش"، تم التنبؤ باحتمالية بقاء الشخصيات الرئيسية على قيد الحياة من منظور البيانات. ستجلب هذه الطريقة البحثية للقصص الخيالية أيضًا الإلهام لحالات تطبيقية مماثلة في الحياة الواقعية.
هناك نوعان فقط من الناس في هذا العالم: أولئك الذين يشاهدون مسلسل Game of Thrones وأولئك الذين لا يشاهدونه.
لقد وصل مسلسل Game of Thrones الذي انتظرتموه جميعًا إلى موسمه الأخير أخيرًا. لقد أصبح شعار عائلة ستارك الذئب، "الشتاء قادم"، حقيقة واقعة أخيرًا، والحرب بين البشر والمشاة البيض على وشك أن تندلع.هل تستطيع تخمين حياة وموت الشخصيات الرئيسية؟

هل يمكنك معرفة ما إذا كانت آريا التي تهتم بها ستنجو، وما إذا كانت ملكة الشهوة ستقتلها آريا فقط بعد مشاهدة كل حلقة؟
في مواجهة هذا العذاب، هناك دائمًا أشخاص لا يستطيعون التراجع. على سبيل المثال،استخدم المبرمجون الذين يحبون البرمجة خوارزميات لتحليل القصص في لعبة العروش وتوقعوا احتمالات بقاء الشخصيات ومن هو الأكثر احتمالا لاعتلاء العرش الحديدي.
ومن المثير للاهتمام أن الخوارزميات والفرق المختلفة تتنبأ بنتائج مختلفة للغاية. على سبيل المثال، تنبأت خوارزمية فريق جامعة ميونيخ التقنية (TUM) بأن دينيريس ستصعد في النهاية إلى العرش الحديدي؛ بينما تحت خوارزمية أخرى، لم تتمكن دينيريس من البقاء على قيد الحياة خلال فصل الشتاء.
بالإضافة إلى ذلك، هناك "خوارزمية" سحرية أخرى: يموت جميع الرجال.
إذن، ما هي التوقعات الصحيحة؟ كل شركة لها اساسها الخاص. دعونا نرى كيف يفعلون ذلك.
يتنبأ التعلم الآلي بأن أم التنين ستبقى على قيد الحياة حتى النهاية
قام طلاب جامعة ميونخ التقنية بمحاولة مثيرة للاهتمام وجريئة في ندوة علوم الكمبيوتر:استخدم علم البيانات وطرق التعلم الآلي للتنبؤ بالفرصة النهائية لبقاء الشخصيات في Game of Thrones. قبل بث الموسم الثامن من مسلسل صراع العروش، كانت الخوارزميات تتنبأ بمصير الشخصيات.

يمكن العثور على القائمة الكاملة لشخصيات Game of Thrones والتنبؤات التفصيلية على
احصل عليه عبر الإنترنت على https://got.show
(مصدر الصورة: https://got.show/)
وفي هذا الاستنتاج،لدى أم التنين أعلى فرصة للبقاء على قيد الحياة (99%)، شيطان يد الملك الخاص بها لديه أيضًا معدل بقاء يصل إلى 97٪. هل يمكن أن تكون أم التنانين قد تولت أخيرًا مسؤولية جميع العائلات الكبرى؟ احتل برون الماكر والحامي لنفسه المرتبة الأولى في ترتيب الموت بـ 93.5%.
من أين جاءت هذه النتيجة؟
فريق جامعة ميونخ التقنيةتم جمع بيانات التحليل من كتب "أغنية الجليد والنار"، وسطور "صراع العروش"، ومحتوى دائرة المعجبين على ويكيبيديا.تتضمن المعلومات المستخدمة في التنبؤات ما يلي: عائلة الشخصية، وما إذا كانت متزوجة أم لا، وحلفاؤها.
قاموا باستخراج مجموعات بيانات مميزة لمئات الشخصيات وقاموا بتمشيط المعلومات حول الشخصيات في القصة. بالإضافة إلى البيانات مثل الجنس والحالة، يتم أيضًا أخذ معلومات البيانات الوصفية في الاعتبار: مثل ما إذا كان شخص ما شخصية رئيسية أو ثانوية، ومدى تكرار الاستشهاد به في قنوات مثل ويكيبيديا.
ومن خلال هذه البيانات، وباستخدام تحليل الخوارزميات، تم الكشف عن بعض الاتجاهات حول معدل الوفيات في لعبة العروش، مثلالرجال أكثر عرضة للخطر من النساء(معدل الوفيات بين الذكور هو 22%، في حين أن معدل الوفيات بين الإناث هو 11%).
وللتوصل إلى توقعات حول مصير كل شخصية مع التنبؤ بالاتجاهات، استخدم الفريق نموذجين منفصلين:الطريقة الأولى هي طريقة الاستدلال البايزي، استخدم طريقة MCMC المضمنة في pymc3 لتدريب نموذج تحليل البقاء البايزي؛أما الثاني فيتعلق بالتعلم الآلي والشبكات العصبية، تم تنفيذه تحت إطار Keras في Python.

قد يكون لعملهم بعض التأثير. في عام 2016، قبل بث الموسم السادس، ابتكر طلاب من نفس الدورة في جامعة ميونيخ التقنية خوارزمية تنبأت بدقة بقيامة جون سنو.
باستخدام تحليل النص: هل ستموت أم التنانين؟
عليك أن تؤمن بأن هناك بالتأكيد أكثر من شخص لديه نفس الفضول.
عالم بيانات آخر، بيتر فيستربيرج من خلال تحليل نص الرواية الأصلية، يمكننا التنبؤ باتجاه أحداث الموسم الأخير.
يعتقد بيتر أن اتجاه القصة مدعوم بالعلاقات بين الشخصيات. من خلال تحليل الكتب الخمسة المنشورة من "أغنية الجليد والنار"، استخدم نظرية الشبكات لحساب العلاقات بين الشخصيات، وعرضها بطريقة بصرية، وحكم على معدل البقاء النهائي بناءً على أهمية الشخصيات.
لقد استخدم نقطة لتمثيل شخصية، واستنادًا إلى النص الموجود في قصة الجليد والنار، استخدم أساليب مثل وضع علامات على أجزاء الكلام وقياس التشابه لتحديد درجة "القرب" بين الشخصيات. كلما ظهر الاسمان بشكل أقرب وأكثر تكرارًا، كلما كانا مرتبطين بشكل أكبر.
تعتمد طريقة الحكم على مدى ملاءمة دور ما للأدوار الأخرى بشكل أساسي على أربعة مفاهيم رئيسية:
- درجة المركزية - نسبة العقد المتصلة مباشرة بالعقدة إلى العدد الإجمالي للعقد؛
- مركزية القرب - كلما اقتربت العقدة من العقد الأخرى، زادت مركزيتها.
- مركزية الوساطة - تقيس عدد المرات التي تعمل فيها العقدة كجسر لأقصر مسار بين عقدتين أخريين؛
- مركزية المتجه الذاتي — تعتمد أهمية العقدة على عدد العقد المجاورة لها وأهمية العقد المجاورة لها.
ومن خلال تحليل هذه المفاهيم، يمكننا الحصول علىرقم "الوزن" لقيمة العلاقة. النتيجة النهائية هي خريطة للعلاقات بين الشخصيات، حيث يشير سمك الخطوط إلى مدى ارتباط الشخصيات ببعضها البعض، ويمثل حجم العقد النهائية أهمية الشخصيات. يُظهر مؤشر الأهمية هذا أيضًا إمكانية "إزالته" بواسطة المؤلف.

التصنيفات المحددة للمؤشرات هي كما يلي:

يتصدر جون التصنيفات في مؤشرات التحليل الأربعة.
وبناء على هذا التحليل، فإن جون سنو هو بلا شك الشخصية الأكثر أهمية. هل من الممكن أن يصعد هذا اللاعب المشتبه به في RMB، والذي ولد في عائلة التنين ونشأ في عائلة الذئب، إلى العرش الحديدي في النهاية؟ ويأتي بعد ذلك من حيث الأهمية العفريت المسؤول عن الاستخبارات وجيمي قاتل الملوك.
من منظور نظرية الشبكة، يبدو أن دينيريس، أم التنانين، أنفقت الكثير من المال في المراحل المبكرة، وربما لم يكن لديها ما يكفي من الذهب في المراحل اللاحقة. إنها على حافة شبكة العلاقات، ويبدو أن هناك احتمالًا كبيرًا أن تكون محكومًا عليها بالفشل.
التوقعات ليست مجرد تسلية، بل لها أهمية عملية أيضًا
نحن لا نعلم أي خوارزمية هي الأفضل بين الخوارزميات المختلفة ذات النتائج المختلفة. ربما سنعرف ذلك فقط عندما تأتي النهاية. لكن الأساليب التي يستخدمونها ليست للمتعة فقط، بل لها قيمة عملية.
إن خوارزمية احتمال البقاء التي طورتها جامعة ميونيخ جاءت من مشروع تعليمي جاد. الهدف الرئيسي من إنشاء هذه الدورة هوسيتعلم الطلاب كيفية تصميم وتطوير ونشر أنظمة الكمبيوتر الذكية.
وقال الدكتور جاي ياتشداف، المشرف الرئيسي على المشروع: "بينما يعتمد التنبؤ بفرص بقاء شخصيات Game of Thrones على البيانات المأخوذة من عالم خيالي، فإن استخدام نفس تقنيات الذكاء الاصطناعي تمامًا في العالم الحقيقي يمكن أن يكون له تأثير كبير على حياتنا اليومية".

قال البروفيسور بوركارد روست، رئيس قسم المعلوماتية في جامعة ميونيخ التقنية: "إن الجمع بين الشغف والتدريس وسيلة رائعة لابتكار أدوات جديدة. وفي دوراتنا في جامعة ميونيخ التقنية، وجدنا طرقًا شيقة لتعليم الطلاب كيفية استخدام هذه التكنولوجيا".
حاليا، في العالم الحقيقي،ويمكن استخدام خوارزميات مماثلة في الطب والتمويل، على سبيل المثال باستخدام تحليل المعلومات المجمعة للتنبؤ بالنتائج الصحية. تتشابه هذه التقنية مع تحليل آثار العلاجات أو المضاعفات على مرضى السرطان.
أما بالنسبة لما فعله عالم البيانات بيتر، فبالإضافة إلى تحليل بقاء الشخصيات، قام أيضًا بتحليل قواعد الكتابة المختلفة لروايات "أغنية الجليد والنار" من منظور رقمي، مستخدمًا البيانات لتحليل عناصر الرواية.
ربما، بعد إتقان هذا النمط،في المستقبل، سيكون الروائيون وكتاب السيناريو قادرين على استخدام الذكاء الاصطناعي لإنشاء محتوى جديد بسرعة.بهذه الطريقة، لن تضطر إلى مشاهدة مارتن وهو يعوض الأخطاء التي يرتكبها.
هل تريد التنبؤ بالبطل الذي سينجو من المنتقمون؟
يبدو أن شهر أبريل الممتع هو موسم آخر من مواسم النهاية. بالإضافة إلى الموسم الأخير من مسلسل Game of Thrones، سيشهد The Avengers أيضًا الحلقة النهائية يوم الأربعاء المقبل. أعتقد أن الكثير من الناس لم يتعافوا بعد من فرقعة أصابع ثانوس، ذلك الرجل القاسي الذي أصر على مشاهدة غروب الشمس بهدوء ودمر نصف الكون بشكل عشوائي.
أعتقد أن الذكاء الاصطناعي لا يستطيع التنبؤ بمعدل الوفيات التعسفي هذا. ومع ذلك، إذا كنت لا تزال فضوليًا للغاية وترغب في تجربته بنفسك، فإن عنوان مشروع المصدر المفتوح لفريق TUM موجود هنا:
ولكن في الواقع، ليست هناك حاجة للتنبؤ بالذكاء الاصطناعي. يجب أن يكون فيلم Avengers 4 هو النهاية الأفضل أيضًا. بعد كل شيء، استخدم الدكتور سترينج طريقة شاملة، أو طريقة التجربة والخطأ، لترك الأمل لعالم المنتقمون: استخدم حجر الزمن لتجربة 14,000,605 احتمالات واختار الاحتمال الوحيد الذي من شأنه أن يؤدي إلى النصر.

من المحتمل أن تكون روح الدكتور سترينج هذه رائعة لكتابة التعليمات البرمجية.