HyperAI

أصدرت مجلة Nature وجامعة كامبريدج وآخرون أول نظام للتنبؤ بالطقس يعتمد على البيانات من البداية إلى النهاية، مما يزيد من سرعة التنبؤ بعشرات المرات

特色图像

في كل يوم عند فجر كل عام، تقوم مئات من أجهزة الكمبيوتر العملاقة في جميع أنحاء العالم بتقطيع الغلاف الجوي إلى ملايين المكعبات الافتراضية واستنتاج مسار حركة الغلاف الجوي للأرض في الأيام العشرة التالية من خلال حل مجموعة من المعادلات التفاضلية الجزئية التي تنطوي على الديناميكا الحرارية، وميكانيكا السوائل، ونقل الإشعاع. لقد تطورت هذه التقنية، والتي تسمى بالتنبؤ العددي بالطقس، لتصبح حجر الأساس في التنبؤ بالطقس الحديث منذ أن اقترح عالم الأرصاد الجوية البريطاني ريتشاردسون فكرة "مصنع التنبؤ بالطقس" في منتصف القرن العشرين. من التنبؤ بمسار الأعاصير إلى تخطيط مسارات الرحلات الجوية، ومن قرارات البذر الزراعي إلى جدولة توليد الطاقة الجديدة، تعمل الصورة ثلاثية الأبعاد للغلاف الجوي العالمي والتي يتم تحديثها كل 6 ساعات بواسطة نظام التنبؤ العددي على إعادة تشكيل الطريقة التي يتواصل بها البشر مع الطقس بدقة مكانية تبلغ 0.01 درجة على خط الطول وخط العرض (حوالي 1 كم).

ومع ذلك، وفي مواجهة المطالب الاجتماعية المتزايدة، تواجه نماذج التنبؤ العددي التقليدية القائمة على المعادلات الفيزيائية معضلة مزدوجة تتمثل في النمو الهائل في التعقيد الحسابي وتضاؤل الفوائد الهامشية الناجمة عن تحسين دقة التنبؤ.وفي هذا السياق، فإن تدخل تكنولوجيا الذكاء الاصطناعي يشبه تركيب جهاز حسي جديد لعلم الغلاف الجوي. عندما تبدأ الشبكات العصبية العميقة في تحليل القوام الدقيق لصور السحب الملتقطة عبر الأقمار الصناعية، وعندما تعمل خوارزميات التعلم المعزز على تحسين مخططات المعلمات بشكل مستقل، وعندما تتدرب الشبكات التنافسية التوليدية على الطقس القاسي في المشاهد الافتراضية، فإن ثورة تكنولوجية في مجال التنبؤ بالطقس تتشكل تدريجيا.

مؤخرا، أطلقت جامعة كامبريدج، بالتعاون مع معهد تورينج، وجامعة تورنتو، ومركز مايكروسوفت للاستخبارات العلمية، والمركز الأوروبي للتنبؤات الجوية متوسطة المدى، والمسح البريطاني للقطب الجنوبي، وجوجل ديب مايند، نظاما مشتركا للتنبؤ بالطقس يعتمد على البيانات من البداية إلى النهاية يسمى Aardvark Weather. من خلال دمج بيانات المراقبة، يمكن للنظام إنشاء توقعات شبكية عالمية وتوقعات للموقع المحلي في وقت واحد.وفي اختبارات المتغيرات الرئيسية المتعددة وأوقات التنفيذ المختلفة، تجاوز أداء التنبؤ العالمي معيار التنبؤ العددي بالطقس التشغيلي التقليدي (NWP).بالنسبة للتنبؤات بالموقع المحلي، يظهر النظام مهارة عالية في التنبؤ مع مهلة زمنية تصل إلى 10 أيام، كما أن أداءه قابل للمقارنة بأداء معيار التنبؤ العددي العالمي الذي تم تحسينه من خلال المعالجة اللاحقة وأنظمة التنبؤ المتقدمة الشاملة التي تتضمن مدخلات من المتنبئين البشريين. يؤدي الضبط الشامل إلى تحسين دقة التوقعات المحلية بشكل كبير.

وتحمل نتائج البحث ذات الصلة عنوان "التنبؤ بالطقس بالاعتماد على البيانات الشاملة"، وقد نُشرت في نسخة غير محررة في مجلة Nature.

عنوان الورقة:

https://www.nature.com/articles/s41586-025-08897-0

يجمع مشروع المصدر المفتوح "awesome-ai4s" أكثر من 100 تفسير لورقة AI4S ويوفر أيضًا مجموعات بيانات وأدوات ضخمة:

https://github.com/hyperai/awesome-ai4s

مجموعات البيانات: التكامل بين المنصات ومتعدد المصادر وبناء استراتيجيات مبتكرة لدمج البيانات

ولضمان استقلال نظام الطقس Aardvark بشكل كامل عن نماذج التنبؤ بالطقس الرقمية التقليدية (NWP) العاملة، قام الباحثون ببناء مجموعة بيانات مراقبة اندماجية متعددة المصادر ومنصات متعددة بعناية.يستخدم النظام فقط بيانات الأقمار الصناعية بمستويات معالجة 1B أو 1C.تشير بيانات المستوى 1B إلى البيانات التي تمت معايرتها وتحديد موقعها الجغرافي، في حين أن بيانات المستوى 1C قد أكملت تصحيح الإشعاع والمعالجة الهندسية بشكل أكبر لضمان أن دقة المراقبة تلبي متطلبات نشر الأعمال. وتغطي كافة البيانات الفترة الزمنية من عام 2007 إلى عام 2020 وتدعم الاستحواذ في الوقت الفعلي، مما يوفر تدفقًا مستقرًا للبيانات للنظام.

تأتي بيانات مراقبة الأراضي من مجموعة بيانات HadISD التابعة لمكتب الأرصاد الجوية في المملكة المتحدة.يحتوي على درجة حرارة السطح عند 8,719 محطة، وضغط الهواء عند 8,016 محطة، وسرعة الرياح عند 8,721 محطة، ودرجة حرارة نقطة الندى عند 8,617 محطة، ويتم تحديثها كل 6 ساعات. تعتمد عمليات رصد المحيطات على مجموعة بيانات ICOADS التابعة للإدارة الوطنية للمحيطات والغلاف الجوي في الولايات المتحدة، والتي تدمج عمليات الرصد في الوقت الفعلي من السفن والعوامات في جميع أنحاء العالم. وتأتي بيانات مراقبة الغلاف الجوي العلوي من أرشيف IGRA التابع للمركز الوطني لمعلومات البيئة، والتي تغطي درجات الحرارة والرطوبة وملامح الرياح لـ 1375 محطة قياس. قام فريق البحث باختيار سجلات المراقبة السطحية ومستويات الضغط الرئيسية بشكل خاص مثل 200 و 500 و 700 و 850 هكتوباسكال.

علاوة على ذلك، دفعت القيود الجغرافية للملاحظات الميدانية الباحثين إلى إدخال بيانات الاستشعار عن بعد متعددة المصادر. استخدمت هذه الدراسة بيانات مقياس التشتت ASCAT من سلسلة أقمار MetOp الصناعية التي قدمتها منظمة EUMETSAT الأوروبية، كما تم بناء شبكة مراقبة تعاونية للميكروويف والأشعة تحت الحمراء بشكل مشترك مع نظام ATOVS (بما في ذلك أجهزة AMSUA وAMSUB وMHS وHIRS/4) المقدمة من NCEI. واستخدم فريق البحث أيضًا بيانات الكشف بالأشعة تحت الحمراء الطيفية الفائقة IASI التابعة للمركز الوطني لمعلومات البيئة لتكملة المعلومات التفصيلية حول التوزيع الرأسي لدرجة الحرارة والرطوبة. بالنسبة لرصد الأقمار الصناعية الثابتة بالنسبة للأرض، اختار فريق البحث منتج GridSat الشبكي التابع لمركز البيانات الوطني، والذي يعمل على إزالة التباين الزمني والمكاني للأقمار الصناعية المدارية من خلال توحيد بيانات الأشعة تحت الحمراء وبيانات قناة بخار الماء.

ومن الجدير بالذكر أنه على الرغم من أن نظام Aardvark يعمل بشكل مستقل تمامًا عن نموذج NWP، فإن بنيته المعيارية تستخدم بذكاء مجموعة بيانات إعادة تحليل ERA5 أثناء مرحلة التدريب. ERA5، الجيل الخامس من إعادة التحليل لمركز التنبؤات الجوية المتوسطة المدى الأوروبي (ECMWF)، هو مجموعة بيانات إعادة تحليل جوي عالمية متطورة توفر سلسلة زمنية مكانية كاملة من المعلمات مثل درجة الحرارة والرطوبة وحقول الرياح من عام 1940 حتى الوقت الحاضر. ومن خلال استراتيجية دمج البيانات المبتكرة هذه، لا يكسر Aardvark Weather حدود النماذج الرقمية التقليدية فحسب، بل يعمل أيضًا على تعظيم مزايا الوقت الحقيقي والدقة العالية للنماذج التي تعتمد على البيانات، مما يفتح نموذجًا جديدًا لتكنولوجيا التنبؤ بالطقس العالمي.

طقس Aardvark: يتطلب طاقة حوسبة أقل ويزيد سرعة التنبؤ بعشرات المرات

Aardvark Weather هو نظام مبتكر للتنبؤ بالطقس يعتمد على التعلم العميق.يتكون هيكلها الأساسي من ثلاث وحدات: وحدة التشفير ووحدة المعالجة ووحدات فك التشفير.تم تصميم النظام للتخلص من الاعتماد على منتجات التنبؤ بالطقس الرقمية التقليدية أثناء مرحلة النشر، مع الاستفادة الكاملة من بيانات إعادة التحليل التاريخية عالية الجودة لتحسين أداء النموذج أثناء مرحلة التدريب.

يكون المشفر مسؤولاً عن دمج بيانات المراقبة متعددة المصادر، سواء الشبكية أو غير الشبكية، لتوليد الحالة الجوية الأولية. تستخدم هذه العملية طريقة غير متكررة، والتي تتجنب بشكل فعال المشاكل مثل عدم استقرار التدرج الذي قد يحدث في التحديث المتكرر لمرشح كالمان في التنبؤ بالطقس الرقمي التقليدي. تعمل وحدة المعالجة على إنشاء توقعات لمدة 24 ساعة بناءً على الحالة الأولية وتمتد إلى فترات زمنية أطول بمساعدة آلية الانحدار التلقائي. يقوم جهاز فك التشفير بتحويل التوقعات الشبكية إلى توقعات للموقع المحلي، ويدعم توسيع المهام المتعددة، ويوسع نطاق تطبيق النظام بشكل أكبر.

كيف يعمل Aardvark

من حيث بنية النموذج، يستخدم المشفر ووحدة المعالجة المحول المرئي (ViT) باعتباره العمود الفقري، ويستخدم فك التشفير شبكة ملتوية خفيفة الوزن. يضمن هذا المزيج كفاءة المعالجة ومرونة النموذج. من حيث استراتيجية التدريب، يستخدم Aardvark أولاً بيانات إعادة التحليل التاريخية عالية الدقة (مثل ERA5) للتدريب المسبق لتعلم كيفية تصحيح تحيزات الملاحظة، ثم يقوم بتحسين كل وحدة من خلال الضبط الدقيق على مراحل لضمان الاتساق بين التدريب والنشر. وأخيرا، من الممكن تحسين دقة التنبؤات الخاصة بالمناطق والمتغيرات المحددة من خلال الضبط الدقيق المشترك. يتيح هذا التصميم المعياري وطريقة التدريب لـ Aardvark أن يكون مستقلاً تمامًا عن النماذج الرقمية التقليدية عند نشره، مما يتيح الاستفادة الكاملة من مزايا الوقت الفعلي والدقة العالية للنماذج المعتمدة على البيانات.

في تقييم أداء توقعات الطقس الشبكية العالمية لشركة Aardvark Weather، قارن فريق البحث هذه التوقعات بأربعة نماذج أساسية. إن أبسط الخطوط الأساسية هي الاستمرارية والمناخ الساعي، والتي تستخدم لتقييم ما إذا كان نظام التنبؤ لديه قدرات أساسية. المقارنة الأكثر تحديًا هي بين نظامي التنبؤ العددي العالميين التشغيليين الأكثر استخدامًا: نظام التنبؤ المتكامل (IFS) التابع للمركز الأوروبي للتنبؤات الجوية متوسطة المدى (ECMWF) مع بيانات HRES عالية الدقة ونظام التنبؤ العالمي (GFS) التابع للمراكز الوطنية الأمريكية للتنبؤ البيئي. تظهر النتائج أن Aardvark مماثل أو حتى أفضل من GFS في معظم أوقات التسليم. علاوة على ذلك، بالنسبة لمعظم المتغيرات، فإن أداء Aardvark قريب من أداء HRES. على الرغم من أن توقعات Aardvark لديها أخطاء أكبر في الغلاف الجوي العلوي وفي فترات زمنية أقصر، وهو ما قد يكون بسبب الملاحظات الأكثر تركيزًا بالقرب من السطح، إلا أنه في فترات زمنية أطول، تميل توقعات Aardvark إلى أن تصبح غير واضحة طيفيًا، وهي ظاهرة شائعة في أنظمة التنبؤ بالطقس التي تعتمد على البيانات.

وتظهر نتائج البحث أيضًا أن Aardvark Weather، باعتباره أول نظام للتنبؤ بالطقس يعتمد بالكامل على البيانات من البداية إلى النهاية، يتعلم رسم الخرائط المباشرة من بيانات المراقبة الخام إلى مخرجات التنبؤ. إنه مستقل تمامًا عن منتجات NWP عند نشره ويعتمد فقط على بيانات المراقبة لتوليد التوقعات. إن سرعة التوليد أسرع بعدة مرات من الأنظمة الحالية. لا يستغرق نظام Aardvark Weather سوى ثانية واحدة تقريبًا على أربع وحدات معالجة رسومية NVIDIA A100 لتوليد توقعات كاملة من البيانات الرصدية. وبالمقارنة، يتطلب نظام التنبؤات الجوية عالية الدقة (HRES) التقليدي التابع للمركز الأوروبي للتنبؤات الجوية متوسطة المدى (ECMWF) ما يقرب من 1000 ساعة عقدة فقط لأداء استيعاب البيانات والتنبؤ. على الرغم من أن كمية بيانات المراقبة المستخدمة أقل بمقدار مرتبة من خط الأساس للأعمال وأن متطلبات موارد الحوسبة أقل بمقدار مرات عديدة من الطرق التقليدية،لا يزال نظام Aardvark ينتج توقعات على شبكة عالمية بمقدار 1.5 درجة ويتفوق على أنظمة التنبؤ العددي بالطقس التشغيلية في خطأ الجذر التربيعي المتوسط (RMSE) عبر متغيرات متعددة وأوقات زمنية متعددة.

تحليل أداء التوقعات العالمية الشبكية استنادًا إلى مجموعة بيانات ERA5

لقد تم استخدام الذكاء الاصطناعي على نطاق واسع في مجال التنبؤ العددي بالطقس

يشهد علم الأرصاد الجوية العالمي في الوقت الحاضر تحولاً نموذجياً بقيادة تكنولوجيا الذكاء الاصطناعي، وقد أظهرت قدرات البحث العلمي في بلدي زخماً قوياً في هذه الثورة التكنولوجية. بالاعتماد على الابتكار التكراري لخوارزميات التعلم العميق،قامت مؤسسات البحث المحلية ببناء نظام نموذجي ذكي يغطي سلسلة التنبؤ بالطقس بأكملها.ولم يقتصر الأمر على تحسين دقة وكفاءة التنبؤات بشكل كبير فحسب، بل ساهم أيضًا في تعزيز التكامل العميق بين الأرصاد الجوية والذكاء الاصطناعي.

على سبيل المثال، باعتباره أول نموذج شبكة عصبية ثلاثية الأبعاد في العالم يتكيف مع نظام إحداثيات الأرض، يكسر نموذج بانجو للأرصاد الجوية من هواوي اعتماد التنبؤات الرقمية التقليدية على المعادلات الفيزيائية. إن استراتيجية تجميع المجال الزمني الهرمي المبتكرة تعمل على قمع تراكم الأخطاء التكرارية بشكل فعال، مما يجعل دقة توقعات الطقس العالمية متوسطة المدى تصل إلى أعلى مستوى في الصناعة عند 0.25 درجة. يتخذ نموذج فوكسي للأرصاد الجوية بجامعة فودان نهجًا مختلفًا، حيث يحقق التنبؤ التعاوني للعناصر الجوية من خلال إطار التعلم متعدد المهام. إن تصميم دالة الخسارة المرجحة حسب خطوط العرض يحل بذكاء نقطة الألم الصناعية المتمثلة في ضعف دقة التنبؤ في المناطق ذات خطوط العرض العالية، وخاصة في تحقيق تحسينات كبيرة في دقة التنبؤ بأحداث هطول الأمطار الصغيرة والمتوسطة.

وفي مجال التنبؤات الخاصة، يستخدم نظام "Fengwu" التابع لمختبر الذكاء الاصطناعي في شنغهاي تكنولوجيا الاندماج المتعدد الوسائط لضغط خطأ التنبؤ لمدة 120 ساعة لمسار الإعصار إلى دقة مذهلة تبلغ 121.4 كيلومترًا، وهو ما يمثل قفزة إلى الأمام مقارنة بالخطأ البالغ 293.8 كيلومترًا في المركز الأوروبي للتنبؤات الجوية متوسطة المدى ECMWF. نجح نموذج التنبؤ بالمحيطات "اسأل البحر" التابع لمختبر لاوشان في دمج مبادئ ديناميكيات المحيطات بشكل مبتكر في بنية الشبكة العصبية، مما أدى إلى بناء أول نظام ذكي للتنبؤ ببيئة المحيطات في العالم بدقة 1/12 درجة.

ليس هذا فقط،  يساهم "برنامج عرض نموذج التنبؤ بالطقس بالذكاء الاصطناعي" الذي تقوده إدارة الأرصاد الجوية الصينية في تسريع تحويل الإنجازات التكنولوجية. تم إصدار أنظمة Fengqing و Fenglei و Fengshun.وهو يمثل تحول تكنولوجيا الذكاء الاصطناعي من البحث إلى التطبيق. ومن بينها نظام "الرياح والرعد" الذي كان رائداً في هندسة هجينة تجمع بين التوجيه المادي والاعتماد على البيانات. إن هذا المسار التقني "الاندماجي الرياضي" يعوض بشكل فعال عن أوجه القصور في نماذج الذكاء الاصطناعي في القدرة على تفسير الأحداث الجوية المتطرفة.يولد نموذج "فنغ تشينغ" الكبير توقعات عالمية لمدة 15 يومًا بسرعة مذهلة تبلغ 3 دقائق، مما يزيد من وقت التنبؤ الفعال للعناصر الأساسية إلى 10.5 أيام.ويمثل نظام التنبؤ الموسمي "فنغشون" الذي يجري إنشاؤه بداية لتوسيع نطاق تكنولوجيا الذكاء الاصطناعي في مجال التنبؤ بالمناخ الأكثر صعوبة.

على الرغم من أن البحث في نماذج الأرصاد الجوية الكبيرة للذكاء الاصطناعي المحلية قد انتقل من التحقق الفني إلى التطبيقات التجارية، إلا أن مزاياها المتمثلة في الكفاءة العالية والتكلفة المنخفضة جلبت نموذجًا جديدًا للتنبؤ بالطقس العالمي. ومع ذلك، فإن إمكانية تفسير الآليات الفيزيائية، وطبيعة البيانات في الوقت الحقيقي، ونمذجة الأحداث المتطرفة لا تزال تشكل مشاكل صعبة تحتاج إلى التغلب عليها. مع التعميق المستمر لإطار اندماج البيانات الفيزيائية وتعزيز التعاون بين التخصصات المختلفة،ومن المتوقع أن تدفع تكنولوجيا الذكاء الاصطناعي توقعات الطقس إلى عصر جديد من الدقة العالية والتطبيق الأوسع، من التوقعات قصيرة الأجل على مستوى الدقيقة إلى توقعات المناخ على نطاق موسمي.