يُمكّن التعلم المُعزّز العميق من تحسين الحماية من الحرائق في المناطق الحضرية. واقترح فريق الأكاديمية الصينية للعلوم طريقة جديدة للتعلم المُعزّز العميق لحل مشكلة تكوين المرافق.

في مجال البناء والتطوير الحضري، يُعدّ التحسين الجغرافي المكاني أمرًا بالغ الأهمية. فهو يلعب دورًا محوريًا في كل شيء، بدءًا من اختيار مواقع المناطق الصناعية ووصولًا إلى تصميم مرافق الخدمات العامة. ومع ذلك، فإن الحلول التقليدية تعاني من قيود عديدة. أما الآن، فقد أتاحت تقنية التعلم العميق فرصًا جديدة.
في الآونة الأخيرة، في الاجتماع الأكاديمي السنوي لعام 2025 للجنة تحليل النموذج الجغرافي والمعلومات الجغرافية للجمعية الجغرافية الصينية،قدم الدكتور ليانغ هاوجيان من معهد ابتكار معلومات الفضاء التابع للأكاديمية الصينية للعلوم عرضًا تقديميًا حول موضوع "التحسين الجغرافي المكاني" تحت عنوان "البحث في طريقة تحسين تكوين مرافق مكافحة الحرائق في حالات الطوارئ الحضرية بناءً على التعلم التعزيزي العميق الهرمي".ويقدم أيضًا مقدمة مفصلة من أربعة جوانب: نظرة عامة على مشاكل التحسين الجغرافي المكاني، والبحث في أساليب التعلم العميق لمشاكل التحسين الجغرافي المكاني، والاستكشافات الجديدة القائمة على التعلم التعزيزي العميق الهرمي، والآفاق المستقبلية.
قامت شركة هايبر إيه آي بجمع وتلخيص مداخلة السيد ليانغ هاوجيان المُعمّقة دون المساس بالقصد الأصلي. وفيما يلي نصّ الخطاب.
التحسين الجغرافي المكاني: التكامل العميق بين الرياضيات والجغرافيا
التحسين الجغرافي المكاني هو مزيج من التحسين التوافقي الرياضي وعلوم المعلومات الجغرافية. وهو مُخصص لحل المشكلات العملية مثل التخطيط المكاني وتخصيص الموارد. وله أهمية بحثية بالغة في مجالات عديدة، مثل البناء الحضري، واختيار مواقع المناطق الصناعية، واختيار مواقع مرافق الخدمات العامة.يمكن التعبير عنها كمشكلة تحسين تتضمن متغيرات القرار والقيود ووظيفة الهدف.تكون متغيرات القرار عادةً أعدادًا صحيحة أو متغيرات 0-1، كما هو موضح في الشكل أدناه.

يمثل القيد (1) نطاق متغير القرار 𝒙، والذي عادة ما يكون عددًا صحيحًا أو متغيرًا من 0 إلى 1.
باستخدام مشكلة الوسيط p الكلاسيكية كمثال،يهدف هذا الأسلوب إلى اختيار مرافق النشر p من بين المرافق المرشحة لتقليل المسافة الإجمالية بين جميع نقاط الطلب وأقرب نقطة مرفق، ويُستخدم غالبًا في اختيار مواقع المرافق العامة. هناك ثلاثة أنواع من الطرق التقليدية لحل مشكلات التحسين المكاني، وهي: الخوارزميات الدقيقة، والخوارزميات التقريبية، والخوارزميات الاستدلالية، ولكن لكل منها عيوبها.
* يمكن للخوارزمية الدقيقة الحصول على الحل الأمثل العالمي،ومع ذلك، فإن التعقيد الحسابي عادة ما يكون مرتفعًا، ويزداد وقت الحل بشكل كبير مع حجم المشكلة.على سبيل المثال، طريقة الفرع والحد، والبرمجة الديناميكية، وما إلى ذلك.
* تعمل الخوارزميات التقريبية على تحسين كفاءة الحل مع ضمان أداء نظري معين.ومع ذلك، فإن تصميم الخوارزمية الخاصة به معقد نسبيًا.على سبيل المثال، استراتيجيات الجشع، والبرمجة الخطية والتقريب وغيرها من الأساليب.
* يمكن للخوارزميات الاستدلالية الحصول على حلول أفضل في وقت أقصر وهي مناسبة للمشاكل المعقدة واسعة النطاق.ومع ذلك، هناك نقص في ضمان الأمثلية النظرية.تشمل الطرق الشائعة محاكاة التلدين، والبحث عن المحرمات، وما إلى ذلك.
التعلم العميق يدخل مجال التحسين الجغرافي المكاني
في مجالات مثل الرؤية الحاسوبية ومعالجة اللغات الطبيعية، استُخدمت النماذج العميقة لتحل محل تصميم الخوارزميات اليدوي، وحققت نتائج باهرة. فهل يُمكن استخدامها لحل مشاكل التحسين المكاني؟ بناءً على هذه الفكرة، استكشف الباحثون التحسين المكاني العصبي، بثلاثة دوافع: تعلم أساليب استدلالية أسرع/أفضل، واستخدام التقريب السريع القائم على البيانات ليحل محل الحسابات المعقدة، وتصميم إطار عام تلقائيًا لخوارزميات استدلالية جديدة، وتدريب نماذج DRL بالمعلومات التاريخية لتوجيه التخطيط المستقبلي.
لذلك، لدي فكرتان رئيسيتان لـNeurSPO:
الأول هو البنية العميقة.ببساطة، الحل يكون فارغًا في البداية، ثم يتم تحديد نقطة في كل مرة حتى يتم تحديد نقاط p المستهدفة لإكمال بناء الحل خطوة بخطوة.
الثاني هو تحسين العمق.جوهرها يشبه خوارزميات مثل البحث المحلي، وهو أسلوب لتحسين الحلول. يمكن استخدام التعلم العميق لاستبدال الحلول. على سبيل المثال، في البحث المحلي، يمكن اختيار نقاط مناسبة للتبادل أو التحسين.
نموذج SpoNet: الاهتمام الديناميكي بالتراكب يحل مشكلة اختيار الموقع
كيف نحل مسائل الأهداف المتعلقة بـ p-Median وp-Center وMCLP في استكشاف أساليب DRL؟ جربنا أولًا نموذج معلومات التغطية الديناميكية + الانتباه.تم اقتراح إطار عمل موحد لحل مشاكل اختيار الموقع، SpoNet.يتكون هيكلها بشكل أساسي من 3 أجزاء:
* في نموذج التعلم العميق، يتفاعل العميل بشكل مستمر مع البيئة ويعظم المكافأة من خلال كمية كبيرة من المحاولة والخطأ واستراتيجيات التعلم، دون الحاجة إلى إنشاء معلومات التسمية.
* يتيح نموذج الانتباه للنموذج أن يتعلم التركيز على أجزاء معينة من تسلسل الإدخال عند فك التشفير، بدلاً من الاعتماد فقط على إدخال فك التشفير.
* أثناء عملية تغطية العقدة، إذا كانت إحدى العقد مغطاة، فإن اختيار نشر المرافق في هذه المرحلة قد يؤدي إلى انخفاض كفاءة التغطية. في نموذج الاهتمام بالتغطية الديناميكية، يتم ترميز إحداثيات الموقع الثابت للمدينة وحالة التغطية الديناميكية بين المدن، ومن خلال إدخال معلومات تغطية خاصة بالمشكلة للترميز، تتحسن قدرة النموذج على فهم علاقات التغطية المكانية، مما يُسرّع عملية الحل. كما هو موضح في الشكل التالي:


طبّقنا هذا النموذج لاستكشاف تحسين تخطيط مرافق الطوارئ في منطقة تشاويانغ ببكين، واخترنا مجموعة بيانات تضم 132 مرفق طوارئ. افترضنا أن أقصى مسافة خدمة لكل نقطة من نقاط المرافق هي كيلومتران.وأخيراً، تم اختيار 20 نقطة كمراكز مركزية من بين 132 منشأة طوارئ مرشحة، والتي غطت أكبر عدد من العقد.
AIAM: نموذج الانتباه التفاعلي التكيفي لحل مشكلة الوسيط p
أسلوب خوارزمية البحث المحلي، الذي يبحث في جوار الحل الحالي ويحاول إيجاد حل أفضل، ناضج نسبيًا. بناءً على ذلك، استكشفنا البحث المساعد المُحسَّن بعمق.أي أنه بناءً على فكرة البحث عن الجوار، يتم استخدام استراتيجية البحث DRL لتحقيق عملية بحث تقريبية سريعة تحل محل الحسابات المعقدة.
في مشكلة تخطيط المسار، توجد علاقات ترتيب مختلفة بين العقد المختلفة، ولكن الحل في مشكلة الوسيط 𝒑 هو مجموعة فرعية من مجموعة المرافق، مما ينتج عنه علاقات توزيع مختلفة بين عقد المستخدمين ونقاط المرافق. لقياس علاقة التوزيع هذه، حددنا التفاعل بين "المستخدم" و"المرفق" واقترحنا نموذج انتباه تفاعلي تكيفي.
يتكون النموذج من ثلاثة أجزاء: مشفر الانتباه التفاعلي، وفك تشفير إزالة العقدة، وفك تشفير إدخال العقدة.كما هو موضح في الشكل التالي:

ثبت,تمكن النموذج من الاحتفاظ بـ 15 مستشفى من أصل 2162 مستوطنة (مواقع الطلب) و 80 مستشفى (مواقع المرافق المرشحة).يتم تقليص المسافة الإجمالية من المناطق السكنية إلى المستشفيات، مما يثبت جدوى نموذج AIAM في السيناريوهات العملية.
تحل تقنية DRL متعددة الطبقات مشكلة تكوين مرافق مكافحة الحرائق في حالات الطوارئ الحضرية
في الوقت الحاضر، تشهد المدن تطورًا سريعًا، ويستمر تزايد وتيرة وتعقيد حالات الطوارئ، وتتفاقم مشاكل الموازنة بين كفاءة وفعالية مرافق إطفاء الحرائق في حالات الطوارئ الحضرية. يصعب على أساليب التنبؤ التقليدية بالحرائق التعامل مع البيانات واسعة النطاق وعالية الدقة، مما يؤدي إلى انخفاض دقة تقييم المخاطر، وتأخر الاستجابة، وعدم قدرة تصميم مرافق الإطفاء على مواكبة التغيرات الحضرية واحتياجات الطوارئ في الوقت الفعلي. في هذا السياق، من الضروري إدخال أنظمة ذكية وديناميكية للتنبؤ بمخاطر الحرائق ومرافق إطفاء الحرائق في حالات الطوارئ، وذلك لتحسين الجوانب العلمية والفعالة للوقاية من الحرائق ومكافحتها في المناطق الحضرية والاستجابة للطوارئ بشكل شامل.
وبناء على هذا،نقوم بتحويل البحث النظري لأطر التعلم العميق نحو تطبيقات واقعية.بهدف تحسين قدرات الوقاية من الحرائق ومكافحتها والاستجابة للطوارئ في المناطق الحضرية، يركز البحث على تحسين دقة التنبؤ بمخاطر الحرائق، وتحسين تخصيص موارد الطوارئ، وتعزيز سرعة ومرونة الاستجابة للطوارئ. ويتحقق ذلك من خلال الجوانب الثلاثة التالية.
الأول هو التعدين والاندماج للميزات المكانية الزمنية متعددة الأبعاد للتنبؤ بمخاطر الحرائق في المناطق الحضرية.
تتكون الشبكة العصبية المكانية الزمنية للتنبؤ بمخاطر الحرائق الحضرية بشكل رئيسي من وحدة استخراج السمات المكانية الزمنية ووحدة إخراج الاندماج. * تلتقط وحدة استخراج السمات المكانية الزمنية تلقائيًا التغيرات الديناميكية في البنية المكانية الحضرية، وتوزيع مرافق مكافحة الحرائق، وإحصاءات الحرائق، والبيانات الجوية في الانتشار الأمامي؛ * تدمج وحدة إخراج الاندماج السمات المكانية الزمنية من خلال آلية الانتباه، وتُخرج في النهاية قيمة التنبؤ بمخاطر الحرائق. كما هو موضح في الشكل أدناه.

والثاني هو بناء نموذج تحسين لتكوين مرافق الحماية من الحرائق في حالات الطوارئ مع الأخذ في الاعتبار عدم اليقين وخسائر الكوارث.
في اختيار المواقع متعددة التغطية، تُدرج عوامل غير مؤكدة مثل تكرار الحرائق، وظروف حركة المرور، وتوزيع الطلب، وتُدرج خسائر الكوارث في دالة الهدف لتحسين متانة مخطط التصميم. وتُوصف التغيرات في معدل حدوث الحرائق، وتدفق حركة المرور، وتقلبات الطلب من خلال توزيع الاحتمالات أو تقدير الفترات الزمنية. في النمذجة، يُدمج خطر الحريق مع البيانات التاريخية والظروف الجغرافية لبناء نموذج احتمالي، وتستند استجابة حركة المرور إلى التوزيع الزمني لسعة حركة المرور وتحليل المحاكاة، ويُستجيب لتغير الطلب مع التطور الديناميكي للمدينة من خلال تحديد نطاق التقلبات أو مجموعة السيناريوهات.
الطريقة الثالثة هي طريقة DRL الهرمية لتحسين تخطيط مرافق مكافحة الحرائق الطارئة.
تعتمد الخوارزمية استراتيجية هرمية لتنسيق التصميم العام والتعديلات المحلية لمرافق الحماية من الحرائق. تتضمن حالة النموذج توزيع المرافق، ومخاطر الحرائق، وظروف حركة المرور، ويتخذ القرار بشأن إنشاء المحطة أو جدولتها في كل لحظة.
نظرة مستقبلية: توسيع الحدود والابتكار المستمر
يشهد مسار البحث العلمي تطورًا مستمرًا. في المستقبل، يخطط فريقنا لاستكشاف مشاكل تحسين جغرافي مكاني أكثر تعقيدًا وعملية من خلال التعاون متعدد التخصصات، والجمع بين أنظمة المعلومات الجغرافية وأساليب التحسين الرياضية وتقنيات التعلم العميق.
وفي هذا الصدد، طرحت بعض الأفكار والآفاق من الجوانب الثلاثة التالية:
* إدخال آلية الحوسبة الجغرافية لتعزيز القدرة على الإدراك المكاني.
لا تزال قدرة الذكاء الاصطناعي على تحسين الفضاء الجغرافي قيد الاستكشاف، والأبحاث الحالية وحدها لا تكفي. في المستقبل، ستساعد نمذجة الآليات المكانية، مثل التضاريس، وإمكانية الوصول إلى الشبكات، والاتصال، على تحسين قدرة النموذج على تفسير البُنى الجغرافية، وقدرته على التكيف العملي.
* تم توسيع نطاق الاستجابة للطوارئ على نطاق واسع وعبر المناطق.
في الوقت الحاضر، يقتصر بحثنا على استكشاف المشاكل الصغيرة، لذلك في المستقبل سوف يمتد تدريجياً حتمًا لاستكشاف مشاكل الاستجابة للطوارئ واسعة النطاق، ومواصلة تحسينه لدعم تحسين الارتباط متعدد المراكز على مستوى التجمعات الحضرية والمستويات الإقليمية، وذلك لتحسين قابلية التوسع والاستقرار والكفاءة الحسابية للطريقة.
* تصميم إطار عمل لخوارزمية DRL أكثر كفاءة.
وفي المستقبل، يمكننا الاستمرار في استكشاف وتحسين آلية تنسيق الاستراتيجية العالية والمنخفضة المستوى وعملية التدريب، وإدخال تقنيات مثل التعاون بين العديد من الوكلاء، والتدريب غير المتزامن، والآليات السببية، وتحقيق حل أكثر فعالية للمشاكل العملية.
باختصار، فإن طريقة DRL الهرمية التي اقترحها فريق الدكتور ليانغ هاوجيان من معهد ابتكار معلومات الفضاء التابع للأكاديمية الصينية للعلوم هي حل ابتكاري للذكاء الاصطناعي في مجال التحسين الجغرافي المكاني.من خلال دمج نموذج الاهتمام بالتغطية الديناميكية ونموذج الاهتمام التفاعلي التكيفي وتكنولوجيا دمج الميزات المكانية الزمنية متعددة الأبعاد، فإنه لا يحل مشاكل تقييم المخاطر المتأخرة وتخصيص الموارد غير الفعال في تخطيط مرافق مكافحة الحرائق التقليدية فحسب، بل يحقق أيضًا التنسيق العالمي والتحسين المحلي لتخطيط مرافق الطوارئ من خلال استراتيجية متعددة الطبقات.
في المستقبل، ومع إدخال آليات الحوسبة الجغرافية وتوسيع نماذج الاستجابة للطوارئ عبر المناطق، من المتوقع أن تُطلق هذه الطريقة إمكانات أكبر في مجالات الحوكمة الحضرية واسعة النطاق وتحسين الربط متعدد المراكز، وأن تُعزز التكامل والابتكار العميقين في تحسين الحيز الجغرافي وإدارة الطوارئ. ومن المأمول أن يحقق مجال تحسين الحيز الجغرافي المزيد من الإنجازات، من خلال الاستكشاف والابتكار المستمرين، ويعزز دعم التنمية الحضرية وإدارة الطوارئ.
حول معهد ابتكار معلومات الفضاء التابع للأكاديمية الصينية للعلوم
الدكتور ليانغ هاوجيان هو مساعد باحث خاص في معهد ابتكار معلومات الفضاء، التابع للأكاديمية الصينية للعلوم.وتتمثل الاتجاهات البحثية الرئيسية في التحسين الجغرافي المكاني، والتعلم التعزيزي العميق، وتحليل البيانات الضخمة للاستشعار عن بعد، والتطبيق الشامل للأرض الرقمية.

يتبنى فريقه، بقيادة الباحث وانغ شاوهوا، رؤيةً تتمثل في "تعزيز التطبيق المتداخل لعلوم الجغرافيا المكانية والذكاء الاصطناعي لتوفير حلول مبتكرة لتحقيق أهداف المدن الذكية والتنمية المستدامة". ويلتزم الفريق باستخدام أساليب الحوسبة المتقدمة وتقنيات الذكاء الاصطناعي لتحليل ومعالجة البيانات الضخمة المكانية والزمانية، بما يحقق اتخاذ قرارات ذكية وتحسين البيئة المكانية.استخدم الفريق تقنيات مثل تحليل البيانات الضخمة المكانية الزمنية والتعلم العميق والتعلم الآلي لإجراء عدد من الدراسات مثل التحسين الجغرافي المكاني والاستشعار عن بعد بالذكاء الاصطناعي.
