Command Palette
Search for a command to run...
تم اختيار NVIDIA لـ NeurIPS 2025، واقترحت نموذج ERDM لحل تحديات التنبؤ طويلة الأجل، وتستمر توقعاتها المتوسطة إلى طويلة الأجل في قيادة معيار EDM.

يُمثل التنبؤ بالطقس على المدى المتوسط (≤15 يومًا) تحديًا كبيرًا وطويل الأمد للمجتمع العلمي. فبصفته نظامًا فوضويًا نموذجيًا، يكون الغلاف الجوي شديد الحساسية للظروف الأولية، ويمكن للأخطاء الصغيرة أن تتفاقم بسرعة، مما يؤدي إلى انحراف التوقعات عن الواقع. في حين أن التنبؤ العددي بالطقس، الذي يستخدم محاكاة الاضطرابات المتعددة لتقدير عدم اليقين، أصبح نهجًا شائعًا،ومع ذلك، فإن موارد الحوسبة الخاصة بها تنمو بشكل كبير مع تحسن متطلبات الدقة والالتزام بالوقت.إن هذا الاختناق يدفع الأوساط الأكاديمية إلى اللجوء إلى أساليب جديدة تعتمد على البيانات سعياً إلى تحقيق اختراقات.
في السنوات الأخيرة، قدّمت الاكتشافات في مجال النمذجة التوليدية حلولاً جديدة لهذه المشكلة. ومن بينها، يُعدّ نموذج انتشار التسلسل المتدحرج (RSDM) نموذجاً نموذجياً لنموذج الانتشار.يتم استخدام آلية جدولة الضوضاء التدريجية لفرض ضوضاء أقوى على حالة التنبؤ طويلة الأمد.يُحاكي هذا النهج التراكم التدريجي لعدم اليقين بمرور الوقت في العالم الواقعي، مما يُحسّن بشكل فعّال من صحة التنبؤات. مع ذلك، لا يزال نموذج RSDM الحالي مبنيًا على إطار نموذج الاحتمالية الانتشاري الخالي من الضوضاء (DDPM) السابق، وقد حدّت قيود بنيته الأساسية، إلى حدٍّ ما، من إمكانية إجراء المزيد من التحسينات على الأداء العام للنموذج.
ومن الجدير بالذكر أننموذج الانتشار الموضح (EDM) من NVIDIA، المقدم في أفضل ورقة بحثية في NeurIPS 2022،من خلال توحيد وتحسين نموذج DDPM الكلاسيكي، تم تحسين استقرار التدريب وجودة التوليد بشكل ملحوظ. إذا أمكن دمج استراتيجيات التحسين الرئيسية، مثل آلية ترجيح فقدان الوقت في EDM، بفعالية في RSDM، فمن المتوقع أن تتحسن دقة النمذجة وكفاءتها التشغيلية بشكل ملحوظ.
وبناءً على ذلك، قام فريق البحث من NVIDIA وجامعة كاليفورنيا في سان دييغو، بالاعتماد على إطار عمل EDM، بتحسين جدولة الضوضاء، ومعلمة شبكة إزالة الضوضاء، وعملية المعالجة المسبقة، واستراتيجية ترجيح الخسارة، وخوارزمية أخذ العينات بشكل منهجي لتلبية احتياجات نمذجة التسلسل، وبناء نموذج انتشار متدحرج واضح ومعزز (ERDM).يركز هذا البحث على التغلب على مشكلة التصميم التعاوني المتمثلة في "جدولة الضوضاء التدريجية" و"ترجيح فقدان الوقت".إنه يوفر مسارًا جديدًا وفعالًا للتنبؤ الاحتمالي للأنظمة الديناميكية الفوضوية.
نتائج البحث ذات الصلة تحمل عنوان "نماذج الانتشار المتدحرجة الموضحة للتنبؤ بالطقس الاحتمالي".تم اختيارها لمؤتمر NeurIPS 2025، وهو مؤتمر أكاديمي بارز في مجال الذكاء الاصطناعي.

عنوان الورقة:
https://doi.org/10.48550/arXiv.2506.20024
قم بمتابعة الحساب الرسمي ورد بـ "ERDM" للحصول على ملف PDF كامل
مزيد من أوراق البحث الرائدة في مجال الذكاء الاصطناعي:
https://hyper.ai/papers
مجموعة البيانات: بيانات الأرصاد الجوية Navier-Stokes وERA5
لدعم تدريب النموذج والتحقق من صحته، اختارت هذه الدراسة نوعين من مجموعات البيانات المرجعية ذات الخلفيات التطبيقية الواضحة، والتي تتوافق مع نمذجة ديناميكيات السوائل ومهام التنبؤ بالطقس متوسط الأمد على التوالي.
في تجارب ديناميكيات السوائل،استخدم الباحثون مجموعة بيانات معيارية لديناميكيات السوائل من Navier-Stokes.بُنيت مجموعة البيانات على بنية شبكية بأبعاد 221×42. وُضعت عوائق دائرية عشوائيًا في كل حالة محاكاة، مما يُغيّر مسار السائل. وللحفاظ على ثبات الظروف التجريبية، ثُبّتت لزوجة السائل في جميع عمليات المحاكاة عند 1×10⁻³. تُسجّل مجموعة البيانات معلومات المجال الفيزيائي الأساسية لحركة السائل، بما في ذلك مجالي السرعة في الاتجاهين x وy، بالإضافة إلى مجال الضغط. أثناء تدريب النموذج واختباره، تُعدّ الظروف الحدية وأقنعة العوائق مدخلات مساعدة لمساعدة النموذج على التقاط تأثيرات الحدود وتأثيرات العوائق بدقة. الهدف من مرحلة الاختبار هو التنبؤ بعملية تطور السائل للخطوات الزمنية الـ 64 التالية بناءً على حالة ابتدائية واحدة.
في اختبار معيار التنبؤ بالطقس متوسط المدى،استخدم الباحثون مجموعة بيانات إعادة التحليل ERA5 لـتبلغ دقتها المكانية 1.5 درجة، ما يُعادل حجم شبكة 240×212. تحتوي مجموعة البيانات على 69 متغيرًا للتنبؤ، تُغطي نوعين رئيسيين من عناصر الأرصاد الجوية: الهواء العلوي والسطح. تتضمن متغيرات الهواء العلوي درجة الحرارة (t)، وارتفاع الجهد الأرضي (z)، والرطوبة النوعية (q)، ومكونات u وv لحقول الرياح في 13 طبقة ضغط (الوحدة: hPa)؛ وتشمل متغيرات السطح درجة الحرارة على ارتفاع مترين (2t)، ومتوسط ضغط مستوى سطح البحر (mslp)، ومكونات u وv لحقول الرياح على ارتفاع 10 أمتار (10u و10v). تستخدم مرحلة تدريب النموذج بيانات ERA5 الساعية من عام 1979 إلى عام 2020 لتغطية خصائص المناخ طويلة المدى؛ وتختار مرحلة التقييم 64 حالة جوية أولية مختلفة عند الساعة 00:00 و12:00 (بالتوقيت العالمي المنسق) في عام 2021 لاختبار أداء التنبؤ متوسط المدى للنموذج في ظل ظروف أولية مختلفة.
نموذج ERDM: دمج الابتكار وتصميم البنية الأساسية لتوفير مسار جديد لنمذجة الأنظمة الديناميكية الفوضوية
تتمثل المساهمة الأساسية لـ ERDM في الجمع بين فكرة "زيادة الضوضاء تدريجيًا مع طول التنبؤ" في نموذج انتشار التسلسل المتداول (RSDM) مع التصميم الطبيعي المثبت لـ EDM.وهو يوفر مسارًا جديدًا يجمع بين الصرامة النظرية والمتانة العملية لنمذجة الأنظمة الديناميكية الفوضوية مثل مسارات حركة السوائل وتسلسلات التنبؤ بالطقس.
يعمل ERDM أولاً على تحسين آلية جدولة الضوضاء.بخلاف الجدولة الخطية أو جيب التمام التقليدية، يستخدم هذا النموذج جدول ضوضاء متجددًا مصممًا خصيصًا لخصائص توليد التسلسل. يقسم هذا النهج فترة التوليد إلى عدة فترات زمنية متتالية، مع تحديد شدة ضوضاء مختلفة لكل فترة، وضمان انتقال سلس بين الفترات المتجاورة. أثناء التدريب، كما هو موضح في الشكل أدناه، يقوم النموذج بأخذ عينات عشوائية من مستويات ضوضاء مختلفة ليتعلم التكيف مع سيناريوهات الضوضاء المختلفة. أثناء التوليد، يتم تخفيف الضوضاء تدريجيًا من مستوى ابتدائي مرتفع، مما يؤدي في النهاية إلى نتائج واضحة. كما يضبط ERDM معلمات الانحناء الرئيسية لتناسب مهام توليد التسلسل بشكل أفضل، مما يحافظ على معلومات أكثر فعالية أثناء عملية إزالة الضوضاء.

وعلى هذا الأساس،يقدم ERDM معادلة التفاضل العادية للتدفق الاحتمالي (ODE)،تُستخدم هذه المعادلة للتحكم الدقيق في إضافة الضوضاء وإزالتها. تصف المعادلة المسار الكامل لتطور البيانات من حالة ضوضاء إلى نتيجة واضحة، ويمكن اعتبارها بمثابة "خريطة توجيه" لعملية التوليد. كما هو موضح في الشكل أدناه، أثناء الاستدلال، يحل النموذج معادلة تفاضلية عادية (ODE) تكراريًا باستخدام الطرق العددية: تُزال الضوضاء تمامًا من البيانات في اللحظة الأولى وتُخرج كنتيجة تنبؤ، بينما يُحتفظ ببعض الضوضاء في اللحظات المتبقية. ثم تُفعّل آلية التدحرج، باستخدام هذه البيانات الخالية من الضوضاء جزئيًا كحالة ترتيب مسبق للجيل التالي، مع إضافة لحظة ضوضاء جديدة، وتُكرر عملية حل معادلة تفاضلية عادية (ODE)، مما يحقق توليدًا مستمرًا للتسلسلات الطويلة.

يدور تدريب ERDM حول شبكة إزالة الضوضاء.تعتمد هذه الشبكة على طريقة المعالجة المسبقة القياسية لـ EDM، ويمكنها معالجة البيانات بشكل تكيفي وفقًا لمستوى الضوضاء في كل لحظة، بهدف استعادة المعلومات الأصلية من التسلسل الضوضائي. وفيما يتعلق باستراتيجية التدريب، تعتمد ERDM طريقة ترجيح "مدركة لعدم اليقين"، والتي لا تحافظ فقط على الترجيح التقليدي لتحقيق استقرار التدريب، بل تمنح أيضًا أوزانًا أعلى لعينات الضوضاء المتوسطة ذات المعلومات الأغنى، مما يوجه النموذج للتركيز على تعلم الحالات المتوسطة المهمة لعملية التوليد. في التدريب النوعي، يبدأ النموذج من تسلسل نظيف، ويضيف ضوضاء عشوائية الشدة، ويحاول استعادة البيانات الأصلية، ويحسن المعاملات بمقارنة الفرق بين التنبؤ والقيمة الحقيقية. وقد أظهرت التجارب أن استخدام تصميم الضوضاء المرتبط بالوقت يمكن أن يعزز استقرار التنبؤات طويلة المدى.
لتحسين التقاط الخصائص الديناميكية لبيانات السلاسل الزمنية، أجرى ERDM تحسينات إضافية على بنية مُزيل الضوضاء. فهو يتخلى عن الالتفاف ثنائي الأبعاد الذي يُدمر الارتباط الزمني والالتفاف ثلاثي الأبعاد المُكلف حسابيًا، ويعتمد بدلاً من ذلك بنية هجينة تجمع بين شبكة U-Net ثنائية الأبعاد والانتباه الزمني. يتولى هيكل شبكة U-Net ثنائية الأبعاد مسؤولية استخراج السمات المكانية لكل لحظة، بينما تلتقط طبقة الانتباه الزمني التبعيات بين اللحظات، وتُدمج معلومات الضوضاء في طبقة التنظيم لتنظيم سلوك الشبكة. يُحقق هذا التصميم توازنًا بين الكفاءة والأداء. على الرغم من أنه أكثر تعقيدًا بقليل من البنية ثنائية الأبعاد الصرفة، إلا أنه يُحسّن جودة التنبؤ بالتسلسل بشكل كبير. بالإضافة إلى ذلك،وتوصلت الدراسة أيضًا إلى أن بيانات السلسلة الزمنية قبل التدريب أكثر فعالية من تعديلها بعد ذلك.ويمكن أن يشكل تآزرًا جيدًا مع الإطار العام.

التقييم التجريبي: الأداء يضاهي أحدث أنظمة التنبؤ بالطقس، مع كفاءة حسابية أعلى
للتحقق من فعالية ERDM في نمذجة الأنظمة الديناميكية الفوضوية، أجرى الباحثون تقييمًا منهجيًا يركز على الهدفين الرئيسيين المتمثلين في دقة التنبؤ الاحتمالي وموثوقية تحديد كمية عدم اليقين.تستخدم التجربة نوعين من المؤشرات الأساسية:تُستخدم درجة الاحتمالية المتدرجة المستمرة (CRPS) لتقييم الانحراف الكلي بين قيمة التنبؤ والملاحظة الفعلية تقييمًا شاملًا. كلما انخفضت القيمة، كان الأداء أفضل. تُقيّم نسبة مهارة الانتشار (SSR) مدى منطقية تقدير عدم اليقين بمقارنة تباين المجموعة بمتوسط خطأ المجموعة. إذا كانت نسبة مهارة الانتشار أقل من 1، فهذا يعني أن عدم اليقين مُقدّر بأقل من قيمته الحقيقية، بينما إذا كانت أعلى من 1، فهذا يعني تقديرًا مبالغًا فيه. يُفضّل أن تكون قريبة من 1.
في تجربة نمذجة السوائل نافير-ستوكس، استخدم الباحثون نماذج مرجعية تتضمن DYffusion ومجموعة من النماذج المرجعية المبنية على EDM. تُظهر النتائج التجريبية أنيظهر ERDM مزايا كبيرة في مرحلة التنبؤ المتأخرة، مع تحسن CRPS الخاص به بنحو 50% مقارنة بأفضل خط أساس EDM.على الرغم من أن أداء نماذج EDM كان أفضل قليلاً في البداية، إلا أن أخطاءها ازدادت بسرعة أكبر مع مرور الوقت. لم يتفوق نموذج DYffusion على معيار EDM طوال فترة التنبؤ. من منظور معايرة عدم اليقين، تفوق نموذج ERDM باستمرار على معيار EDM مع نقص كبير في التشتت، لكن الدراسة وجدت أن هذا الأخير عانى من تحسين المعايرة مع الحفاظ على أداء CRPS.

في مهمة التنبؤ بالطقس متوسطة المدى الأكثر تحديًا ERA5، تشمل معايير المعهد معايير EDM الداخلية ونماذج الأعمال الخارجية مثل IFS ENS وNeuralGCM ENS وGraph-EFM. من حيث الكفاءة الحسابية،يتطلب ERDM فقط 4 وحدات معالجة رسومية H100 لمدة 5 أيام من التدريب، وهو أقل بكثير من الطرق الأخرى المعتمدة على البيانات.تُظهر النتائج التجريبية أن ERDM يتفوق باستمرار على معيار EDM من حيث مؤشرات CRPS، حيث وصل أقصى تحسن إلى 10%. كما أنه يتفوق على Graph-EFM. بالمقارنة مع IFS ENS وNeuralGCM، يُعد ERDM منافسًا، ولكنه لا يزال أدنى قليلاً من IFS ENS في التنبؤ قصير المدى ببعض المتغيرات. يُظهر التحليل أن هذا مرتبط بطريقة بناء المجال الأولي، ويمكن تحسينه بشكل أكبر في المستقبل من خلال استراتيجية تهيئة IFS ENS. تجدر الإشارة إلى أن ERDM وIFS ENS يُظهران معًا أفضل أداء في معايرة الاحتمالات، بينما تُعاني النماذج الأخرى القائمة على البيانات عمومًا من مشاكل نقص الانتشار قصير المدى. من حيث الاتساق المادي،يتوافق طيف الطاقة المتوقع لمدة 14 يومًا والذي تم إنشاؤه بواسطة ERDM بشكل كبير مع IFS ENS.إنه يظهر واقعية فيزيائية متفوقة على معظم نماذج التعلم الآلي، في حين يظهر NeuralGCM انخفاضًا واضحًا في تقدير الطاقة في نطاقات التردد المتوسط والعالي.

عصر جديد من التنبؤ بالفوضى: بناء جسر جديد بين اليقين والعشوائية
في مجال نمذجة الأنظمة الديناميكية الفوضوية والتنبؤ بالتسلسلات، الذي يركز عليه ERDM، تواصل الأوساط الأكاديمية والتجارية العالمية تعزيز الإنجازات المبتكرة في هذا المجال من خلال التكامل متعدد التخصصات وتطبيق التكنولوجيا. لا تقتصر هذه الاستكشافات على مواصلة النهج الأساسي المتمثل في "دمج المسبقات الفيزيائية مع البيانات"، بل توسّع أيضًا آفاق تطبيقات التنبؤ الاحتمالي وتقدير عدم اليقين.
من ناحية أخرى، تُركز الإنجازات الأكاديمية على الابتكارات العميقة في ديناميكيات الموائع وهندسة نماذج الانتشار. تعاونت جوجل ديب مايند مع فرق من جامعة نيويورك وجامعة ستانفورد ومؤسسات أخرى لتطوير...الجمع بين شبكة المعلومات العصبية الفيزيائية (PINN) مع مُحسِّن Gauss-Newton عالي الدقة،ولأول مرة، تم اكتشاف تفردات غير مستقرة جديدة بشكل منهجي في ثلاثة أنواع من معادلات السوائل، بما في ذلك معادلات نافير-ستوكس، مما يوفر نموذجًا جديدًا لاستكشاف المشهد المعقد لمعادلات التفاضل الجزئية غير الخطية.
عنوان الورقة:اكتشاف التفردات غير المستقرة
عنوان الورقة:https://go.hyper.ai/iGh6t
على مستوى تحسين بنية نموذج الانتشار،يجمع إطار عمل قوة الانتشار (DF) الذي اقترحه فريق MIT CSAIL بين مزايا نموذج الانتشار التسلسلي الكامل والتنبؤ الانحداري التلقائي.من خلال تحديد مستوى ضوضاء مستقل لكل رمز واعتماد بنية سببية، يُحسّن استقرار ومرونة توليد التسلسلات الطويلة. ويمكن لاستراتيجية إرشاد شجرة مونت كارلو (MCTG) المُشتقة أن تُحسّن بشكل كبير كفاءة أخذ العينات للمسارات عالية المكافأة، وقد أثبتت فعاليتها في مجالات مثل تخطيط الروبوتات والتنبؤ بالفيديو.
عنوان الورقة:إجبار الانتشار: التنبؤ بالرمز التالي يلتقي بانتشار التسلسل الكامل
عنوان الورقة:https://arxiv.org/pdf/2407.01392
على الجانب الآخر،وتركز الممارسات المبتكرة في مجتمع الأعمال بشكل أكبر على تنفيذ التكنولوجيا على أساس السيناريوهات وتحسين كفاءتها.لقد أثبت هذا النموذج قيمته الكبيرة في التنبؤ بالطقس والتنبؤ بالسلاسل الزمنية متعددة المجالات. أطلقت هواوي، بالتعاون مع مكتب الأرصاد الجوية في تشونغتشينغ، نموذج "تيان زي 12 ساعة" للتنبؤ بالطقس المدعوم بالذكاء الاصطناعي (الإصدار 2.0). يستند هذا النموذج إلى البنية المتداخلة لنموذج بانغو واسع النطاق، ويدمج بيانات الرادار الدقيقة وبيانات التضاريس عالية الدقة. ومن خلال تحسين الوزن المكاني الزمني، يزيد دقة التنبؤات إلى كيلومتر واحد في الساعة. وخلال عاصفة تشونغتشينغ الممطرة، صوّر النموذج بدقة أنماط نطاقات المطر وكثافة هطول الأمطار. وفي مجال التنبؤ بالسلاسل الزمنية العامة، يحقق نموذج DeepAR من أمازون، باستخدام بنية LSTM واستراتيجية تدريب مشتركة، تنبؤًا احتماليًا للسلاسل الزمنية متعددة المتغيرات. يقيس توزيع الاحتمالات المُولّد عدم اليقين بفعالية، وقد طُبّق في سيناريوهات مثل إدارة مخزون التجزئة والتنبؤ باستهلاك الطاقة. ويُحسّن دقة التنبؤات من خلال رصد الارتباطات بين السلاسل الزمنية.
في المستقبل، ومع تطور النماذج الأساسية وتكامل المعرفة متعددة التخصصات، تُنشئ ERDM والمسارات التقنية المماثلة تدريجيًا جسرًا يربط بين المعادلات الحتمية وعدم اليقين في العمل الفعلي. ولن تخدم هذه النماذج مهام الحوسبة العلمية التقليدية، مثل التنبؤ بالطقس ومحاكاة السوائل، فحسب، بل ستوفر أيضًا جيلًا جديدًا من أسس النمذجة الاحتمالية لمشكلات اتخاذ القرارات المتسلسلة المعقدة، مثل تخطيط الروبوتات وجدولة الطاقة، وحتى الديناميكية الحيوية.
روابط مرجعية:
1.https://mp.weixin.qq.com/s/v7uuViL8gF0-5dNEGBR_aw
2.https://mp.weixin.qq.com/s/e5WVUW-HtoOPj4Kef9JwGA
3.https://mp.weixin.qq.com/s/58ZxgFiXqT4efdfygm_t9g