وقد اقترحت جامعة هونج كونج وآخرون نموذج التنبؤ بالطقس التدريجي VA-MoE، والذي يحتوي على معلمات مبسطة بواسطة 75% ولا يزال يحقق أداء SOTA.

لطالما واجهت التنبؤات الجوية، وهي مجال رئيسي يؤثر على العمليات الاجتماعية وقرارات الوقاية من الكوارث، تحديات هائلة ناجمة عن النظام الجوي المعقد والمتغير باستمرار. ولكل تحسن في قدرات التنبؤ آثار عميقة على الإنتاج البشري والحياة. ولطالما كان التنبؤ العددي بالطقس (NWP) النهج السائد في هذا المجال. بالاعتماد على معادلات ديناميكيات الغلاف الجوي، يحاكي هذا التنبؤ تطور متغيرات رئيسية مثل درجة الحرارة والضغط الجوي وسرعة الرياح من خلال حل المعادلات التفاضلية الجزئية، مما يحقق استنتاجًا عدديًا لأنظمة الطقس.
في السنوات الأخيرة، مع التقدم الهائل في تكنولوجيا الذكاء الاصطناعي، أظهر التعلم العميق إمكانات كبيرة في النمذجة الجوية بفضل قدرته القوية على التعرف على الأنماط المكانية الزمنية.وقد أدى ذلك إلى ظهور مجال متعدد التخصصات يسمى "الذكاء الاصطناعي للطقس (AI4Weather)".لكن،تعتمد معظم نماذج الأرصاد الجوية القائمة على الذكاء الاصطناعي على افتراض مثالي مفاده إمكانية الحصول على جميع المتغيرات الجوية في آنٍ واحد أثناء التدريب والتنبؤ. وهذا يتعارض بشدة مع واقع الملاحظات الفعلية، حيث تتنوع مصادر البيانات ويتفاوت تواتر جمعها.على سبيل المثال، تعتمد درجات الحرارة في المرتفعات العالية على الأقمار الصناعية أو المسبارات الراديوية، التي تُحدَّث ببطء. في الوقت نفسه، تُراقَب هطول الأمطار السطحية وسرعة الرياح آنيًا بواسطة محطات مكتظة بالسكان. هذا التزامن في البيانات يستلزم إعادة تدريب كاملة للنموذج عند إدخال متغيرات جديدة، مما يؤدي إلى تكاليف حسابية باهظة للغاية.
ولمواجهة هذا التحدي،قامت فرق بحثية من مؤسسات مثل جامعة هونج كونج وجامعة تشجيانغ بتصميم نموذج جديد لـ "التنبؤ المتزايد بالطقس (IWF)" وأطلقت "المزيج التكيفي المتغير للخبراء (VA-MoE)".يستخدم النموذج التدريب التدريجي وآليات تضمين مؤشرات المتغيرات لتوجيه وحدات الخبراء المختلفة للتركيز على أنواع محددة من المتغيرات الجوية. عند إضافة متغيرات أو محطات جديدة، يمكن توسيع النموذج دون الحاجة إلى إعادة تدريب كاملة، مما يقلل بشكل كبير من التكاليف الحسابية مع ضمان الدقة.
وقد تم قبول نتائج البحث ذات الصلة، والتي تحمل عنوان "VA-MoE: مزيج متغيرات متكيف من الخبراء للتنبؤ المتزايد بالطقس"، من قبل ICCV25، المؤتمر الدولي الأبرز في مجال الرؤية الحاسوبية.
أبرز الأبحاث:
* أول استكشاف منهجي لنموذج جديد للتعلم التدريجي في التنبؤ بالطقس، وإنشاء معيار للتقييم الكمي لقابلية التوسع في النموذج وقدرات التعميم
* اقتراح VA-MoE، أول إطار عمل مصمم خصيصًا للنمذجة الجوية التدريجية، والذي يحقق التخصص المتخصص من خلال تنشيط المتغيرات السياقية التي يقودها تضمين مؤشر المتغير
* أظهرت التجارب واسعة النطاق المستندة إلى مجموعة بيانات ERA5 أن VA-MoE يتفوق بشكل كبير على النماذج المماثلة في التنبؤ بالمتغيرات عالية الارتفاع عندما يتم تقليص حجم البيانات إلى النصف ويتم تقليص عدد المعلمات إلى 25%.

عنوان الورقة:
https://arxiv.org/abs/2412.02503
تابع الحساب الرسمي ورد "VA-MoE" للحصول على ملف PDF كامل
مزيد من أوراق البحث الرائدة في مجال الذكاء الاصطناعي:
تقسيم متغيرات الهواء العلوي والأرضي في مجموعة بيانات ERA5
تعتمد هذه الدراسة على مجموعة بيانات إعادة تحليل الغلاف الجوي الرئيسية ERA5، الصادرة عن المركز الأوروبي للتنبؤات الجوية متوسطة المدى (ECMWF)، كأساس تجريبي، وتغطي بيانات الرصد الجوي المستمر من عام ١٩٧٩ حتى الآن. تستخدم التجارب التقليدية دقة مكانية قدرها ٠.٢٥ درجة (أي ما يعادل حجم شبكة ٧٢١×١٤٤٠)؛ أما في تجربة الإزالة، وللتحكم في التعقيد الحسابي، فيُستخدم إصدار بدقة ١.٥ درجة (حجم شبكة ١٢٨×٢٥٦) لضمان التوازن بين قابلية تكيف البيانات وكفاءة الحوسبة في سيناريوهات تجريبية مختلفة.
من منظور الوقت، يتم توزيع مجموعة البيانات بشكل واضح على مراحل مختلفة من التجربة:
* تستخدم مرحلة التدريب الأولية 40 عامًا من البيانات من عام 1979 إلى عام 2020 لوضع الأساس للاحتياطي الأساسي للمعرفة الجوية للنموذج؛
* تستخدم مرحلة التدريب التدريجي 20 عامًا من البيانات من عام 2000 إلى عام 2020 للتكيف مع متطلبات تحسين المعلمات بعد إدخال متغيرات جديدة؛
* خلال مرحلة الاختبار، تم اختيار بيانات المتغيرات الجوية لكامل عام 2021 لاستخدام بيانات مستقلة للتحقق من قدرة النموذج على التعميم على عينات غير مرئية، وتجنب تأثير تسرب البيانات على مصداقية النتائج.
* من حيث التكوين المتغير، كما هو موضح في الشكل أدناه، تتضمن التجربة 5 متغيرات هوائية علوية و5 متغيرات سطحية:
* متغيرات الهواء العلوي: تشمل خمسة أنواع: Z (ارتفاع الجهد الأرضي)، Q (الرطوبة النوعية)، U (سرعة الرياح الشرقية-الغربية)، V (سرعة الرياح الشمالية-الجنوبية)، وT (درجة الحرارة). يُعرّف كل نوع عند 13 طبقة ضغط مختلفة، ويُستخدم بشكل أساسي في مرحلة تدريب النموذج الأولية لبناء القدرات الأساسية لنمذجة ديناميكيات الغلاف الجوي.
* المتغيرات الأرضية: بما في ذلك درجة الحرارة 2 متر T2M، وسرعة الرياح الشرقية 10 أمتار U10، وسرعة الرياح الجنوبية 10 أمتار V10، ومتوسط ضغط مستوى سطح البحر MSL، والضغط السطحي SP، وما إلى ذلك، يتم تقديمها كمتغيرات متزايدة في المرحلة الثانية من النموذج (مرحلة التدريب المتزايدة) لمحاكاة سيناريو التوسع الديناميكي للمتغيرات في الملاحظات الفعلية.

VA-MoE: بنية نموذجية للتنبؤ بالطقس قابلة للتكيف مع المتغيرات من أجل التعلم التدريجي
يدور المنطق التشغيلي الأساسي لـVA-MoE حول "نموذج التدريب المكون من مرحلتين".كما هو موضح في الشكل أدناه، فإنه يحاكي بالكامل سيناريو "التوسع التدريجي للبيانات" في الملاحظات الفعلية: المرحلة الأولى هي "المرحلة الأولية"، حيث يتم استخدام المتغيرات عالية الارتفاع فقط لتدريب النموذج، مما يسمح للنموذج أولاً بفهم القوانين الديناميكية الأساسية للغلاف الجوي العلوي؛ المرحلة الثانية هي "المرحلة التدريجية"، حيث يتم إضافة المتغيرات الأرضية أثناء تجميد المعلمات المدربة للمرحلة الأولى، ويتم تدريب الوحدات المضافة حديثًا للمتغيرات الجديدة فقط، مما يشكل في النهاية نموذجًا كاملاً.

ومن منظور الهندسة المعمارية، كما هو موضح في الشكل أدناه،يستخدم VA-MoE برنامج Transformer باعتباره العمود الفقري الأساسي له، ولكنه أجرى تحسينات رئيسية للخصائص متعددة المقاييس والمترابطة بقوة للبيانات الجوية.عندما يُعالج النموذج بيانات الإدخال، تمر خصائص الإدخال التي يستخرجها المُرمِّز أولاً عبر طبقة تطبيع وطبقة استهداف ذاتي. يُدمج مُخرَج طبقة الاستهداف الذاتي مع وصلة متبقية. ثم يمر عبر طبقة تطبيع أخرى قبل إدخاله في وحدة VA-MoE الأساسية لإجراء حسابات تكيفية متغيرة. لتجنب فجوات المعرفة الناتجة عن "التدرجات المتلاشية" أثناء تدريب الشبكة العميق، يُدمج الإطار أيضًا آلية "اتصال متبقي": بعد كل خطوة حسابية، تُحفظ بعض الخصائص الأصلية، مما يضمن استمرار الشبكات عالية المستوى في وراثة المعلومات الجوية الأساسية المُستخرجة من الطبقات الأدنى (مثل تأثير التضاريس على سرعة الرياح القريبة من السطح)، مما يُحسّن بشكل كبير استقرار نمذجة السلاسل الجوية طويلة المدى.

على مستوى تحسين التدريب، يتبنى VA-MoE آلية "خسارة المفصل متعدد المهام" لتحقيق التوازن بين دقة التنبؤ والاتساق المادي.تتكون هذه الآلية من مكونين أساسيين: خسارة التنبؤ الديناميكي، التي تُحسّن الأوزان بناءً على الخصائص الفيزيائية للمتغيرات. تُمنح المتغيرات سريعة التغير، مثل درجة الحرارة وسرعة الرياح، أوزانًا أعلى لتعزيز القدرة على رصد التغيرات العابرة. أما بالنسبة للمتغيرات بطيئة التغير، مثل ارتفاع الجهد الجيوفيزيائي، فيُستخدم تعديل تدريجي للوزن للحفاظ على استقرار التنبؤات طويلة المدى، وبالتالي التغلب على فقدان السمات الديناميكية الرئيسية المرتبطة غالبًا بالنماذج التقليدية. علاوة على ذلك، يُقدم النموذج خسارة إعادة بناء كمهمة مساعدة. من خلال بنية مُشفّر-فكّ تشفير، يُطلب من النموذج استعادة المجال الجوي الأصلي بدقة أولًا، مع تعلّم خصائص أساسية مثل الحفاظ على الطاقة والكتلة في الغلاف الجوي في هذه العملية، قبل تنفيذ مهمة التنبؤ.
وعلى هذا الأساس، كما هو موضح في الشكل أدناه،يقوم النموذج ببناء نظام خبير من "التخصص + التعاون".بالنسبة للمتغيرات الأساسية الخمسة في مرحلة التدريب (مثل Z500، ودرجة الحرارة، وسرعة الرياح)، تم تكوين "خبراء تكيف القنوات" (CAEs) مستقلين لكل متغير. على سبيل المثال، يركز خبير التكيف مع القنوات (CAE) الخاص بدرجة الحرارة فقط على التطور المكاني الزمني لدرجة الحرارة، ويجمع بين "علامة هوية" درجة الحرارة لرصد السمات الرئيسية (مثل فرق درجة الحرارة اليومي والتغيرات المفاجئة في درجة الحرارة أثناء مرور الجبهات)، مما يُحسّن دقة التنبؤات أحادية المتغير من خلال النمذجة المتخصصة. علاوة على ذلك، تم إعداد وحدة "خبير مشترك" لدمج مخرجات المعلومات المحلية من جميع خبراء التكيف مع القنوات (CAEs) والتقاط الارتباطات على مستوى النظام بين متغيرات متعددة (مثل التفاعل المتسلسل لارتفاع درجة الحرارة ← انخفاض ضغط الهواء ← زيادة سرعة الرياح). هذا يُجنّب "إغفال التفاصيل" بسبب التخصص المفرط، ويضمن قدرة النموذج على استعادة السلوك الديناميكي العام للنظام الجوي.

التحقق من أداء VA-MoE: دقة مماثلة للنماذج السائدة، مع مزايا التعلم التدريجي الكبيرة
لتقييم الفعالية الفعلية لـVA-MoE في التنبؤ بالطقس بشكل منهجي، قام فريق البحث ببناء نظام تجريبي كامل يعتمد على بيانات الأرصاد الجوية الحقيقية، مع التركيز على الأبعاد الثلاثة "الدقة والكفاءة وقابلية التوسع".
يتمحور جوهر التجربة حول مقارنة نموذج VA-MoE بتسعة نماذج ذكاء اصطناعي جوية سائدة حاليًا (بما في ذلك Pangu-Weather وGraphCast وClimaX، وغيرها)، بما في ذلك ارتفاع الجهد الأرضي Z500 عند 500 هكتوباسكال، وسرعة الرياح الشرقية U10 على ارتفاع 10 أمتار، ودرجة الحرارة T850 عند 850 هكتوباسكال، ودرجة الحرارة T2M على ارتفاع مترين، وغيرها، مع التركيز على تقييم أداء التنبؤات خلال 5 أيام. يكمن الاختلاف الرئيسي في منطق التدريب: فالنماذج المقارنة تستخدم في الغالب الطريقة التقليدية المتمثلة في "التدريب المشترك لمرة واحدة لمتغيرات الارتفاعات العالية والأرض".تتبنى VA-MoE استراتيجية تدريجية من مرحلتين "الارتفاع العالي أولاً، ثم الأرض"، وهو ما يسلط الضوء على مزاياها في التوسع المتغير.
من حيث دقة التوقعات،كما هو موضح في الشكل أدناه، يُظهر نموذج VA-MoE أداءً جيدًا في التنبؤات السطحية والعلوية. بالنسبة للمتغيرات السطحية الرئيسية مثل T2M وU10، تُضاهي دقة توقعات VA-MoE دقة توقعات Stormer وGraphCast، وتتفوق بشكل ملحوظ على نماذج مثل ClimaX وFourCastNet، مما يُحافظ على استقرار التنبؤات قصيرة وطويلة الأجل. وبالتوسع في متغيرات مثل V10 وضغط مستوى سطح البحر (MSL)، تزداد ميزة VA-MoE وضوحًا، حيث تتخلف قليلاً عن GraphCast فقط في T2M، وتُضاهي النماذج الرئيسية مثل FengWu وFuXi.

من حيث كفاءة التدريب،يمكن لنموذج VA-MoE، الذي تم تدريبه في الوضع التدريجي استنادًا إلى 40 عامًا من البيانات، تحقيق دقة مماثلة مع نصف العدد القياسي للتكرارات فقط؛ حتى إذا تم تقليص البيانات إلى 20 عامًا وتم تقليص عدد التكرارات إلى الربع، لا يزال النموذج قادرًا على الحفاظ على الدقة القابلة للاستخدام في الأعمال، مما يقلل بشكل كبير من التكلفة الحسابية الناجمة عن التوسع المتغير.
يؤكد التنبؤ بالمتغيرات الجوية العلوية بشكل أكبر على الميزة التدريجية لـVA-MoE.قارنت الدراسة ثلاث استراتيجيات تدريب: نموذج VA-MoE المُدرّب فقط على متغيرات الهواء العلوي، ونموذج VA-MoE المُدمج تدريجيًا مع متغيرات الأرض (IL)، ونموذج تدريب مشترك تقليدي. أظهرت النتائج أن نموذج VA-MoE المُدرّب فقط على متغيرات الهواء العلوي حقق دقةً تُضاهي دقة GraphCast، وتفوق على IFS وPangu-Weather. علاوةً على ذلك، لم يُظهر نموذج VA-MoE المُدمج تدريجيًا أي تراجع في أدائه التنبئي لمتغيرات الهواء العلوي بعد دمج متغيرات الأرض، بل حسّن دقته في التنبؤات طويلة المدى لارتفاع الجهد الجيوفيزيائي 500 هيكتوباسكال (Z500)، مُثبتًا قدرته على "تعلم أشياء جديدة دون فقدان الأشياء القديمة".
لمزيد من التحقق من فعالية هيكل النموذج، أجرى الفريق تجارب استئصال لمقارنة VA-MoE مع المحول البصري (ViT) وامتداده الخبير (ViT+MoE). على الرغم من أن ViT+MoE يحتوي على ضعف عدد معاملات VA-MoE تقريبًا، إلا أن VA-MoE حقق دقة أعلى بكثير عند فترات التنبؤ التي تبلغ 6 ساعات، و3 أيام، و5 أيام. وهذا يوضح مزايا آلية "الخبير المتكيف مع القناة" حتى في السيناريوهات المقيدة بالمعاملات، مما يجعله مناسبًا بشكل خاص لبيئات الأعمال ذات المتغيرات المتوسعة ديناميكيًا.
الذكاء الاصطناعي يقود الابتكار في التنبؤ بالطقس، ويدفع حدود النماذج العددية التقليدية
في إطار التركيز الذي توليه وزارة البيئة والموارد الطبيعية على "التكيف بكفاءة مع المتغيرات المتعددة، وخفض تكاليف التحديث، وتحسين دقة التوقعات"، تعمل المجتمعات الأكاديمية والتجارية العالمية معًا لتعزيز الابتكار المتعمق بشكل مستمر في نموذج النمذجة الجوية.
حقق المجتمع الأكاديمي اختراقات مهمة في مجال ابتكار بنية النماذج وكفاءة استخدام البيانات من خلال التركيز على الاختناقات التكنولوجية الأساسية.Aardvark Weather، الذي تم تطويره بشكل مشترك من قبل جامعة كامبريدج ومعهد آلان تورينج ومايكروسوفت للأبحاث، هو أول نظام ذكاء اصطناعي شامل خالٍ تمامًا من الأطر الرقمية التقليدية.وقد نجح في تحقيق رسم الخرائط المباشرة من بيانات المراقبة متعددة المصادر إلى توقعات عالية الدقة، الأمر الذي لم يقلل بشكل كبير من الاعتماد على موارد الحوسبة الفائقة فحسب، بل أدى أيضًا إلى تقصير دورة تطوير النماذج الخاصة من عدة أشهر إلى عدة أسابيع، مما يؤكد بشكل كامل جدوى الأعمال الخاصة بالمسار القائم على البيانات الصرفة.
عنوان الورقة:التنبؤ بالطقس القائم على البيانات الشاملة
عنوان الورقة:https://www.nature.com/articles/s41586-025-08897-0
تم تطوير نظام FuXi-Weather من قبل جامعة فودان بالتعاون مع معهد شنغهاي للعلوم والتكنولوجيا والاستخبارات، والإدارة الصينية للأرصاد الجوية، ومؤسسات أخرى.لقد كان رائدًا في تحقيق نمذجة شاملة من البداية إلى النهاية، بدءًا من درجة حرارة سطوع الأقمار الصناعية وصولًا إلى نتائج التنبؤات، متحررًا بذلك من الاعتماد على النماذج العددية التقليدية في بداياتها. حتى في المناطق قليلة الرصد، مثل أفريقيا، لا تزال دقة توقعاته تتفوق بثبات على نظام HRES التابع للمركز الأوروبي للتنبؤات الجوية متوسطة المدى.
عنوان الورقة:نظام التعلم الآلي لتحويل البيانات إلى توقعات للطقس العالمي
عنوان الورقة:https://www.nature.com/articles/s41467-025-62024-1
يركز مجتمع الأعمال على تنفيذ التكنولوجيا وتكييف السيناريوهات، مما يدل على القدرات الهندسية المتميزة.أطلقت شركة Google DeepMind تقنية GraphCast التي تعتمد على بنية الشبكة العصبية الرسومية المتقدمة.بعد تدريبه باستخدام بيانات إعادة تحليل ERA5، يُمكنه إنجاز تنبؤات جوية عالمية للأيام العشرة القادمة في غضون دقيقة واحدة. تتجاوز دقة مؤشراته 90% بين 1380 متغير اختبار، وهو ما يفوق دقة نظام HRES. كما يُمكنه تحديد إشارات الطقس المتطرفة، مثل الأعاصير والأنهار الجوية، بفعالية قبل 3 أيام من حدوثها. تُعزز استراتيجية المصدر المفتوح انتشار هذه التقنية.
عنوان الورقة:مجموعة بيانات UT-GraphCast Hindcast: أرشيف عالمي لتوقعات الذكاء الاصطناعي من جامعة تكساس في أوستن لتطبيقات الطقس والمناخ
عنوان الورقة:https://arxiv.org/abs/2506.17453
يعتمد نموذج Aurora الكبير الذي طورته شركة Microsoft على استراتيجية مكونة من مرحلتين "التدريب المسبق - الضبط الدقيق".بفضل بنيته المرنة التي تضم 1.3 مليار معلمة، يحقق دقة شاملة تبلغ 89% في مهام متعددة، مثل الطقس وجودة الهواء والتنبؤ بالأمواج. سرعة الحوسبة أسرع بـ 5000 مرة من النماذج الرقمية التقليدية، ويمكن تعديله بسرعة ليتناسب مع مختلف سيناريوهات الأعمال من خلال الضبط الدقيق.
عنوان الورقة:نموذج أساسي لنظام الأرض
عنوان الورقة:https://www.nature.com/articles/s41586-025-09005-y
وبالنظر إلى المستقبل، ومع الإثراء المستمر لبيانات المراقبة متعددة المصادر والتطور المستمر للنماذج الأساسية، من المتوقع أن تلعب الذكاء الاصطناعي للأرصاد الجوية دورًا أكبر في التحذير من الطقس المتطرف وتقييم تغير المناخ والخدمات الصناعية المهنية، وتحويل دوره تدريجيًا من "التنبؤ المساعد" إلى "قيادة عملية صنع القرار"، وتوفير الدعم الفني الأكثر ذكاءً للمجتمع البشري للتعامل مع تحديات الطقس والمناخ.