تحليل عملي للتنبؤ بالأحداث النادرة في السلاسل الزمنية باستخدام بايثون
في سياق تحليل السلاسل الزمنية، غالبًا ما تُعتبر القيم المتطرفة "انحرافات" لا تمثل النمط الطبيعي، ويُقال إنها تحدث بتردد ضئيل ولا تستحق الاهتمام. لكن في الواقع، هذه القيم ليست مجرد أخطاء أو شوائب — بل قد تحمل معلومات حيوية عن النظام المُراقب. في هذا المقال، يتناول الكاتب، باحث دكتوراه في هندسة الطيران بجامعة سينسيناتي، كيفية نمذجة القيم المتطرفة في بيانات الطقس باستخدام لغة بايثون، مع التركيز على دراسة القيم القصوى والدنيا في درجات الحرارة عبر مدن مختلفة. تم استخدام مجموعة بيانات من كاغل تتضمن قياسات درجات الحرارة (بكلفن) عبر 36 مدينة على مدار أكثر من خمس سنوات. بدلاً من تجاهل القيم الشاذة، يُقترح تحويلها إلى "أحداث نادرة" من خلال تحديد نافذة زمنية (مثل يومية أو شهرية) واستخراج القيمة العظمى في كل نافذة، ما يُنتج سلسلة من القيم المتطرفة التي يمكن تحليلها إحصائيًا. تم تطبيق نموذج توزيع القيم المتطرفة باستخدام ثلاث توزيعات رئيسية: توزيع القيم المتطرفة العام (GEV)، وتوزيع جومبل (Gumbel) كحالة خاصة من GEV، وتوزيع ويبيول المُقلوب (Weibull_min). لاختيار التوزيع الأفضل، تم استخدام مقاييس إحصائية مثل الاحتمالية اللوغاريتمية (Log-likelihood)، ومؤشر أكايكي (AIC)، ومؤشر بيز (BIC)، التي توازن بين دقة النموذج وتعقيده. أظهرت النتائج أن التوزيع المختار يختلف حسب المدينة: فبينما احتفظت دالاس، بيتسبرغ، وكيانس كيتي بـ GEV كأفضل نموذج، اتضح أن نيو يورك يتناسب بشكل أفضل مع توزيع ويبيول المُقلوب. هذه النتائج تُبرز أن السلوك الإحصائي للقيم المتطرفة ليس موحدًا، بل يعتمد على خصائص كل مدينة ونظامها البيئي. كما تم تحليل النموذج من خلال رسم بياني (Q-Q plot) يُظهر تطابقًا قويًا بين البيانات الملاحظة والتوزيع المُناسب، مُثبتًا أن التوزيعات التقليدية مثل الطبيعي لا تناسب هذه البيانات بسبب انحيازها الشديد. كما تم تطبيق النموذج تلقائيًا على جميع المدن باستخدام دالة مُصممة خصيصًا، مما يُظهر قابلية التوسع والتنظيم في النهج. النتيجة الأساسية تكمن في تحوّل من رؤية "الانحرافات" إلى "إشارات ذات معنى". فعندما ترتفع درجة الحرارة بشكل قياسي في مدينة ما، قد يشير ذلك إلى أزمة تكييف، أو ارتفاع في استهلاك الطاقة، أو حتى أحداث مناخية مُقلقة. وبالمثل، في السياقات المالية أو الصناعية، تمثل القيم المتطرفة فُرصًا أو مخاطر حقيقية. باستخدام أدوات برمجية مُهيكلة وقابلة لإعادة الاستخدام، يمكن تحويل تحليل القيم المتطرفة من ممارسة يدوية إلى عملية منهجية وقابلة للقياس. هذا النهج لا يُحسّن دقة النماذج فحسب، بل يُعمّق الفهم الديناميكي للأنظمة المعقدة التي تُنتج سلاسل زمنية حقيقية.
