جامعة ولاية كولورادو تطلق نموذج CSU-MLP للتنبؤ بالطقس القاسي في منتصف المدة باستخدام خوارزمية الغابات العشوائية

تؤثر توقعات الطقس، وخاصة توقعات الطقس القاسية، بشكل كبير على عمل الناس وحياةهم اليومية. ويظهر تقرير البحث الذي أعدته شركة سيجما بعنوان "الكوارث الطبيعية في أوقات التراكم الاقتصادي وتغير المناخ" أن الخسائر العالمية الناجمة عن الظروف الجوية القاسية استمرت في الارتفاع في السنوات الأخيرة. في عام 2019 وحده،وبلغت الخسائر الاقتصادية العالمية الناجمة عن الكوارث المرتبطة بها 146 مليار دولار أميركي، في حين بلغت خسائر التأمين 60 مليار دولار أميركي.وأشار التقرير أيضا إلى أنه مع تزايد تدمير الكوارث المناخية الشديدة، فإن الخسائر المرتبطة بها سوف تتفاقم في المستقبل. ولذلك، فمن الضروري بشكل خاص التنبؤ بشكل دقيق بالطقس القاسي.
في الآونة الأخيرة، قام آرون جيه هيل وروس إس شوماخر من جامعة ولاية كولورادو وإسرائيل جيراك من مركز التنبؤ بالعواصف (SPC) التابع للإدارة الوطنية للمحيطات والغلاف الجوي (NOAA) بتطوير نموذج التعلم الآلي القائم على الغابات العشوائية، CSU-MLP.النموذج قادر على التنبؤ بدقة بالطقس القاسي في المدى المتوسط (4-8 أيام).وقد نشرت النتائج في مجلة الطقس والتنبؤات الجوية.

وقد نشرت النتائج في مجلة الطقس والتنبؤات الجوية.
عنوان الورقة:
https://arxiv.org/abs/2208.02383
نظرة عامة على CSU-MLP
تتم التنبؤات الجوية القاسية في الولايات المتحدة بشكل عام من قبل مركز التنبؤ بالطقس المذكور أعلاه باستخدام نموذج التنبؤ بالطقس العددي (NWP)، والذي يمكنه التحذير من طقس قاسٍ محدد وموقع حدوثه قبل 1-2 يوم.ومع ذلك، قبل 3-8 أيام فقط، لا نستطيع أن نحذر إلا من المكان الذي سوف يحدث فيه الطقس، ولكن لا نستطيع التنبؤ بنوع الطقس القاسي الذي سوف يكون عليه.
في العقد الماضي، ظهر نموذج التنبؤ العددي بالطقس عالي الدقة (CAMs) (نماذج السماح بالحمل الحراري). أصبحت التوقعات ضمن نطاق زمني أقل من 4 أيام (قصيرة الأمد) أكثر دقة، ولكن بالنسبة للفترات الزمنية المتوسطة والطويلة الأمد، لم يتحسن تأثير التنبؤ بشكل كبير. وفي هذا السياق،يتم تطبيق التعلم الآلي تدريجيا في مجال الأرصاد الجوية.
في دراسة CSU-MLP (احتمالات التعلم الآلي بجامعة ولاية كولورادو)، جاءت البيانات الجوية لتدريب النموذج من مجموعة بيانات إعادة التنبؤ لنظام التنبؤ العالمي للمجموعة الإصدار 12 (GEFSv12) (المشار إليها فيما يلي باسم GEFS/R)، والتي تحتوي على 20 عامًا من بيانات الطقس التاريخية التفصيلية للولايات المتحدة القارية.وقد اختار الباحثون تسع سنوات من البيانات (2003-2012) كمجموعة تدريب لهذه الدراسة التنبؤية متوسطة الأمد.تم اختيار عامين (2020-2022) كمجموعة اختبار.
خوارزمية الغابة العشوائية
تعتمد هذه الدراسة على خوارزمية التعلم الآلي المسماة الغابة العشوائية (RF).الغابة العشوائية هي عبارة عن خوارزمية تصنيف وانحدار تعتمد على التعلم الجماعي.على وجه التحديد في هذه الدراسة، تم إدخال خصائص الطقس القاسي وتم عبور شجرة القرار بأكملها للحصول على نتائج التنبؤ بالطقس القاسي.
لذلك، فإن ميزة إدخال الطقس السيئ لها أهمية خاصة في خوارزمية الغابة العشوائية.قام الباحثون باستخراج 12 متغيرًا مميزًا مرتبطًا بالطقس القاسي من مجموعة التدريب المذكورة أعلاه للتدريب.وتظهر المتغيرات المميزة المحددة في الجدول التالي.

ومع ذلك، في مجموعة بيانات GEFS/R، فإن دقة هذه المتغيرات المميزة ليست متسقة، لذلك قام الباحثون بمعالجة الاستيفاء.تم توحيدها إلى مسافة شبكية قدرها 0.5 درجة (مسافة شبكة ديرجي).
هندسة الميزات
بالإضافة إلى استخدام الغابات العشوائية لتحليل إمكانيات التنبؤ بالطقس القاسي على المدى المتوسط، تم استكشاف هندسة الميزات بشكل موجز في هذه الدراسة. تشير هندسة الميزات إلى تقنية معالجة البيانات المستخدمة لجمع الميزات من حول الأحداث المرصودة وتحويلها إلى نموذج يمكن استخدامه بواسطة خوارزميات التعلم الآلي. على وجه التحديد في هذه التجربة، اقترح الباحثون بشكل رئيسي طريقتين لتبسيط الميزات.بما في ذلك المتوسط المكاني للميزات والتأخر الزمني.
يشير المتوسط المكاني إلى قيام الباحثين بأخذ القيمة المتوسطة لجميع المتغيرات المميزة عند كل نقطة في مساحة التنبؤ.لذايمكن تقليل تداخل البيانات المشوشة لتحسين أداء النموذج.وتظهر العملية المحددة في الشكل أدناه.

تشير طريقة الفارق الزمني إلى عملية التنبؤ أو النمذجة.التطبيق المتأخر للملاحظات من فترة زمنية في الماضي على التنبؤات أو النمذجة في نقطة زمنية حالية.
ويستند هذا إلى افتراض أن البيانات الرصدية السابقة يمكن أن توفر معلومات مفيدة حول الحالة الحالية والاتجاهات المستقبلية.في هذه التجربة، استخدم الباحثون طريقة الفارق الزمني لتوسيع حجم مجموعة بيانات GEFS/R.لكن هذه العملية لا تولد أي جهد حسابي إضافي للنموذج.
نتائج الاختبار
قام الباحثون باختبار تنبؤات CSU-MLP باستخدام 1.5 سنة من توقعات الطقس في الوقت الحقيقي من GEFSv12 وقارنوها بالتنبؤات اليدوية التي تم إنشاؤها بواسطة SPC. وتظهر نتائج الاختبارات ذات الصلة أنفي نطاق التنبؤات متوسطة المدى، تكون دقة ومنطقة التنبؤ لنظام التنبؤ القائم على الغابات العشوائية أفضل من تلك الخاصة بنظام التنبؤ SPC.كما هو موضح في الشكل أدناه. ومع ذلك، مع زيادة نطاق الوقت، سوف تنخفض قدرات التنبؤ لكليهما.

الشكل (أ) هو توقعات CSU-MLP لمدة 4 أيام، والشكل (ب) هو توقعات SPC لمدة 4 أيام. في،تمثل المنطقة المظللة احتمالية الطقس القاسي المتوقعة.تشير الرموز الدائرية إلى توقعات SPC المحلية للأعاصير (الأحمر)، والبرد (الأخضر)، والعواصف (الأزرق)، والزوايا السفلية اليسرى واليمنى من الصورة هي درجة مهارة التنبؤ BSS لتقييم دقة التنبؤات الجوية وتغطية المراقبة لتقييم تمثيلية التنبؤات الجوية المحلية، على التوالي.
وفي هذا الصدد، استنتج الباحثون أن مهارة ودقة نظام التنبؤ بأكمله قد تحسنت بشكل كبير.يرجع هذا بشكل رئيسي إلى أن نظام التنبؤ الذي يعتمد على الغابات العشوائية يتمتع بقدرات تنبؤ قوية في كل من الاحتمالات المستمرة والخطوط ذات الاحتمالات المنخفضة (الخطوط التي تشكلها المناطق ذات الاحتمالية المنخفضة في تقدير الطقس القاسي)..
بالإضافة إلى ذلك، قام الباحثون أيضًا باختبار تأثير المناطق المختلفة والعوامل المختلفة (الديناميكا الحرارية والحركية) على التوقعات.تم استكشاف المتغيرات المميزة لتكون مهمة للتنبؤ بالطقس القاسي.وتظهر النتيجة في الشكل أدناه.

وعلى الرغم من أن التأثيرات المحددة للعوامل والمناطق المذكورة أعلاه على التوقعات لا تزال بحاجة إلى مزيد من الدراسة، فقد توصل الباحثون إلى حكم أولي: سوف يتعلم النموذج هذه المتغيرات المميزة المختلفة بشكل أكبر وسوف يستخدمها في التنبؤ بالطقس القاسي. وهذا يظهر أيضا أنتم تدريب وتحسين نظام التنبؤ المبني على الغابة العشوائية بشكل أكبر، وأصبح يتمتع بقدر معين من المصداقية والعملية.
وبطبيعة الحال، أشار الباحثون خلال هذه التجربة أيضًا إلى أن هناك العديد من الجوانب التي لا تزال بحاجة إلى تحسين في نظام التنبؤ المبني على الغابات العشوائية. على سبيل المثال،تحتاج CSU-MLP أيضًا إلى إضافة بيانات التنبؤ الخاصة بالتنبؤ اليدوي لـ SPC.تحسين مصداقية نتائج توقعات التعلم الآلي بشكل أكبر.
قد تكون هناك مرحلة جديدة من الأرصاد الجوية الذكية القائمة على الذكاء الاصطناعي قادمة
لقد سعى البشر دائمًا إلى فهم العالم والتنبؤ به، وأحد الأمثلة الأكثر نجاحًا هو التنبؤ بالطقس. في العصور القديمة، كان الناس يقومون في الغالب بعمل توقعات بناءً على تجاربهم الحياتية، مثل "إذا كان هناك ضوء الصباح، فلا تخرج، ولكن إذا كان هناك ضوء المساء، فيمكنك السفر آلاف الأميال". في العصر الحديث،بدأ العلماء في استخدام أجهزة الاستشعار والأقمار الصناعية الخاصة بالطقس لجمع كميات هائلة من البيانات لإجراء توقعات أكثر دقة.
ومن الجدير بالذكر أنه في المرحلة الحالية من تطور الأرصاد الجوية، فإن إضافة الذكاء الاصطناعي عززت بشكل كبير دقة التوقعات الجوية. وبحسب تقارير إعلامية أجنبية،في السنوات الأخيرة، نجح الباحثون السويسريون في مجال الأرصاد الجوية في التنبؤ بموعد وموقع البرق من خلال استخدام الذكاء الاصطناعي.يتمتع النموذج حاليًا بدقة تنبؤ تبلغ 80%.
وفي الوقت نفسه، في وقت مبكر من عام 2015، أنفقت شركة IBM 2 مليار دولار للاستحواذ على الأصول الرقمية والبيانات لشركة Weather Co.، الشركة الأم لشركة Weather Channel. وكان السبب وراء إنفاق الشركة لمثل هذا المبلغ الكبير من المال هو أنها خططت لدمج بيانات الطقس ومعلومات التنبؤ الخاصة بشركة Weather Co. مع خدمة الذكاء الاصطناعي Watson. مرئي،تشعر شركات عملاقة مثل IBM بتفاؤل كبير بشأن إمكانات الذكاء الاصطناعي في مجال الأرصاد الجوية، وقد بدأت في وضع الخطط.
ليس من الصعب التنبؤ بذلك. على الرغم من وجود الآلاف من العوامل الموضوعية التي تؤثر على تغيرات الطقس، إلا أنه لا يزال من الصعب التنبؤ بالطقس بشكل دقيق.ولكن مع تعمق تكامل الذكاء الاصطناعي والأرصاد الجوية، قد يأتي عصر جديد من الأرصاد الجوية الذكية التي تحددها الذكاء الاصطناعي بشكل أسرع.
ملاحظة:
سيتم نشر الكود ومجموعة البيانات الخاصة بهذه الورقة على الموقع الرسمي لـ HyperAI Hyper.ai. يمكن للشركاء المهتمين الاستمرار في الاهتمام~