HyperAI

نموذج صغير، إنجاز كبير! تتمكن الشبكات العصبية من رؤية التباين المكاني ووصف الظواهر الجغرافية المعقدة بدقة

特色图像

لتعزيز تعميم الذكاء الاصطناعي من أجل التنمية المستدامة- تقليل حواجز نشر نتائج البحث العلمي للمؤسسات الأكاديمية، وتوفير منصة اتصال لمزيد من علماء الصناعة وعشاق التكنولوجيا والوحدات الصناعية،تخطط شركة HyperAI لعقد سلسلة من البث المباشر بعنوان "Meet AI4S".قم بدعوة الباحثين أو الوحدات ذات الصلة الذين يعملون بشكل عميق في مجال الذكاء الاصطناعي للعلوم لمشاركة نتائج أبحاثهم وأساليبهم وأفكارهم في شكل مقاطع فيديو.

في الحلقة الأولى من سلسلة البث المباشر "Meet AI4S"،يشرفنا أن ندعو دينغ جيالي، طالب الدكتوراه في الاستشعار عن بعد ونظم المعلومات الجغرافية من جامعة تشجيانغ،وقد نشر مختبر تشجيانغ الإقليمي الرئيسي لمعلومات الموارد والبيئة، حيث يعمل، عددًا من نتائج الأبحاث عالية القيمة في مجالات التكنولوجيا الفائقة الوطنية مثل أنظمة المعلومات الأرضية والجغرافية الرقمية والاستشعار عن بعد وأنظمة تحديد المواقع العالمية.

هذه المشاركة،ألقى الدكتور دينغ جيالي كلمة بعنوان "الشبكات العصبية تقدم تفسيرات جديدة للتباين المكاني لأسعار المساكن".شارك نتائج أبحاثه الأخيرة. كما جمعت هذه الدراسة بين مقياس القرب المكاني (OSP) المحسن بواسطة شبكة عصبية مع طريقة الانحدار المرجح للشبكة العصبية الجغرافية لبناء نموذج osp-GNNWR. من خلال حل العلاقة الانحدارية المكانية غير الثابتة بين المتغير التابع والمتغير المستقل، يتم تحقيق تدريب الشبكة العصبية، والتي يمكنها وصف العمليات المكانية المعقدة والظواهر الجغرافية بشكل أكثر دقة.

انقر لمشاهدة الإعادة المباشرة الكاملة⬇️

https://www.bilibili.com/video/BV14W42197on

قام HyperAI بتجميع وتلخيص المشاركة المتعمقة للدكتور دينغ جيالي دون انتهاك النية الأصلية.

تعزيز التطور المستقبلي للعلوم من منظور قابلية تفسير النماذج

باعتباري مستكشفًا للعلوم الجغرافية، إذا كان النموذج الذي توصلنا إليه لا يستطيع سوى التنبؤ بأسعار المساكن، فإن مثل هذه النتائج ستكون مملة بالنسبة لي.إن ما نسعى إليه هو تقديم تفسير علمي معقول للعمليات أو الأنماط الجغرافية باستخدام سلسلة من معاملات الانحدار الناتجة عن هذه النماذج والتي تختلف باختلاف المواقع المكانية.ويعتبر هذا النوع من الأبحاث أكثر تقدما وأكثر عملية. وبناءً على هذه الرؤية اخترت موضوع "الشبكات العصبية تقدم تفسيرات جديدة للتباين المكاني في أسعار المساكن" لأشاركه معكم اليوم.

قبل فترة، نشر فريقنا ورقة بحثية بعنوان "نموذج الشبكة العصبية لتحسين مقياس القرب المكاني في نهج الانحدار المرجح جغرافيًا: دراسة حالة حول أسعار المساكن في ووهان" في المجلة الدولية لعلوم المعلومات الجغرافية، وهي مجلة معروفة في مجال علوم المعلومات الجغرافية.
عنوان الورقة:
https://www.tandfonline.com/doi/full/10.1080/13658816.2024.2343771

في هذه الدراسة، قدمنا طريقة الشبكة العصبية لربط مقاييس القرب المكاني المتعددة بشكل غير خطي (مثل المسافة الإقليدية، ووقت السفر، وما إلى ذلك) بين نقاط المراقبة.تم الحصول على مقياس القرب المكاني الأمثل (OSP)، وبالتالي تحسين دقة التنبؤ بأسعار المساكن في النموذج.

لحل المشكلات التي لا يمكن فيها لـ "القرب المكاني" المجرد إنشاء وظائف الخسارة وصعوبة تدريب الشبكات العصبية، قمنا أيضًا بدمج OSP مع طريقة الانحدار المرجح للشبكة العصبية الجغرافية (GNNWR).تم إنشاء نموذج osp-GNNWR.ويتم تدريب الشبكة العصبية من خلال حل العلاقة الانحدارية المكانية غير الثابتة بين المتغير التابع والمتغير المستقل. وفي نهاية المطاف، تبين أن النموذج يتمتع بأداء عالمي أفضل ويصف العمليات المكانية المعقدة والظواهر الجغرافية بدقة أكبر.

وبعد ذلك، سأستخدم هذه النتيجة كمثال لأشارك معكم العملية المحددة لكيفية قيام الشبكات العصبية بتوفير تفسيرات جديدة للتباين المكاني لأسعار المساكن.

خلفية البحث: الإنجازات البحثية العلمية في ظل التحديات المزدوجة

"التباين المكاني" هو أحد العوامل الرئيسية المسببة لتقلبات أسعار المساكن، ولكن طريقة قياس المسافة الواحدة غير كافية لالتقاط "التباين المكاني" لأسعار المساكن في بيئة جغرافية معقدة؛ ويواجه نموذج الانحدار المرجح جغرافيًا التقليدي أيضًا تحديات في قياس القرب المكاني. وبسبب هذه العوامل اخترنا إجراء هذه الدراسة.

التباين المكاني: تعبيرات مختلفة في مساحات مختلفة

أولاً، اسمحوا لي أن أقدم لكم بعض المعلومات الأساسية عن التباين المكاني والانحدار المرجح جغرافياً.

نموذج الانحدار الخطي العادي OLS هو الطريقة الإحصائية الأساسية والأكثر استخدامًا لتحديد علاقة الانحدار بين المتغيرات. ويستخدم صيغة موجزة للغاية لوصف العلاقة بين المتغير التابع والمتغيرات المستقلة المتعددة. كما هو موضح في الشكل أدناه، فإن y يساوي حد المقطع بالإضافة إلى حاصل ضرب العديد من معاملات الانحدار والمتغيرات المستقلة.

عندما نطبق الأساليب الإحصائية مثل المربعات الصغرى العادية على الجغرافيا،في كثير من الأحيان يكون من الضروري مراعاة الخصائص المكانية المتأصلة لبعض القضايا الجغرافية.وقد أدى هذا إلى ظهور أبحاث ذات صلة بالإحصاءات المكانية والنمذجة المكانية الزمنية.

يفترض نموذج الانحدار الخطي العادي أن معامل الانحدار مستقل عن الموقع المكاني والزماني لبيانات العينة، وأن المعامل المحسوب للمتغير المستقل يكون عند المستوى المتوسط لمنطقة الدراسة.

لكن،ستظهر علاقة الانحدار في العمليات الجغرافية الحقيقية اختلافات في المواقع المكانية المختلفة.إذا أخذنا أسعار المساكن كمثال، فإن العوامل الرئيسية المؤثرة على منزل بنفس الحجم في وسط المدينة وضواحيها مختلفة، وبالتالي فإن علاقات الانحدار الخاصة بها تأخذ أشكالاً مختلفة أيضاً.نحن نطلق على هذه الخاصية اسم التباين المكاني (عدم الثبات المكاني).

التباين المكاني هو سمة متأصلة في وصف العلاقة بين العناصر الجغرافية، وهو التعبير التفاضلي عن العلاقة أو بنية العناصر الجغرافية في مواقع زمنية ومكانية مختلفة. وهذا يعني أن آلية توليد البيانات في مواقع مكانية مختلفة تختلف، الأمر الذي سيتجلى في شكل نماذج انحدار مقابلة، أو أن المعلمات ستتغير مع الموقع المكاني.

الانحدار المرجح جغرافيًا: التحول من القرب المكاني إلى الأوزان عبر وظائف النواة

الانحدار الموزون جغرافيًا (GWR) هو أسلوب نمذجة للعمليات غير المتجانسة مكانيًا اقترحه الأكاديمي الأمريكي أ. ستيوارت فوثرينغهام.

من الصيغة الموضحة في الشكل أدناه، يمكننا أن نرى أنه على الرغم من أن الشكل العام لـ GWR لا يزال عبارة عن علاقة انحدار خطية، إلا أن مصطلح اعتراضه ومعامل الانحدار أصبحا علاقة تعيين مع موضع الإحداثيات (ui، vi). وهذا يعني أنه في مواضع إحداثيات مختلفة، تكون علاقة الانحدار مختلفة.ستتغير أيضًا علاقة الانحدار التي تعكسها الصيغة بأكملها مع اختلاف المواضع المكانية.

من الصعب تحديد معاملات الانحدار لـ GWR.الطريقة الأكثر استخدامًا للحل الآن هي مشابهة لـ OLS، والتي تستخدم طريقة المربعات الصغرى المرجحة للحل.

في الصيغة الموضحة في الشكل أدناه، يتم استخدام مصفوفة الوزن القطرية W لترجيح العينات، والتي يمكن أن تعكس الارتباط المكاني بين المتغيرات المستقلة. خاصة،يتم حساب الأوزان بين العينات على أساس القرب المكاني للعينات.كلما اقتربت نقطتان في الفضاء، كلما كان الارتباط أقوى. سنخصص له وزنًا أكبر ونستخدمه لبناء نموذج.

كيف يمكن تحقيق التحويل من القرب المكاني إلى الوزن؟تستخدم GWR دالة أساسية، مثل دالة أساسية Gaussian، ودالة أساسية bisquare، وما إلى ذلك، لتحويل القرب المكاني إلى وزن، وبالتالي تحقيق بناء المعادلة المرجحة. ومع ذلك، فإن هذا النهج له بعض القيود.

في الماضي، كان مفتاح نمذجة العمليات غير المتجانسة مكانيًا هو تصميم وإنشاء دالة نواة الوزن المكاني الزمني استنادًا إلى قياس القرب المكاني الزمني، ثم استخدام نظرية الانحدار المرجح المحلي لإنشاء دالة حل الهدف غير الثابتة. ومن خلال حل معايير تقييم النموذج على النحو الأمثل، تم التوصل إلى النمذجة الجغرافية للعلاقات غير الثابتة المكانية الزمنية.
تركز الأبحاث الحالية حول هذه الطريقة أيضًا على تحسين نطاق استخدام وظائف النواة، ومن ثم إنشاء نموذج نواة هجين مع معلمات نطاق ترددي متعددة.ومع ذلك، يتم تجاهل تحسين وتطوير بنية وظيفة النواة نفسها:على سبيل المثال، يعد نظام بنية وظيفة النواة الحالي مع تحليل المعلمة الفردية باعتباره الأساس بسيطًا نسبيًا، ومن الصعب تقدير التأثير المعقد للقرب المكاني الزمني على الأوزان المكانية الزمنية بشكل كامل، مما يؤدي إلى عدم القدرة على حل الخصائص غير الثابتة المكانية الزمنية للعلاقات الجغرافية المعقدة بدقة.

مع التطور المستمر للبيانات الضخمة في السنوات الأخيرة، يجب علينا أن نعطي اللعب الكامل لمزايا البيانات الضخمة في بيئة البيانات الضخمة والاستفادة بكفاءة من قدرة التجهيز غير الخطي للشبكات العصبية العميقة.يعد استخدام الشبكات العصبية لشرح التباين المكاني حلاً عمليًا لمعضلة التطوير الحالية لطرق نمذجة العلاقة المكانية الزمنية.

كيف يمكن استخدام الشبكات العصبية لتفسير التباين المكاني؟

اندماج SWNN، GNNWR لديه قدرة تعميم أقوى

في السابق، اقترحنا نموذج الانحدار المرجح للشبكة العصبية الجغرافية GNNWR، والذي يستخدم شبكة عصبية عميقة (شبكة عصبية مرجحة مكانيًا SWNN) لتعيين سلسلة من الأوزان المكانية للعينات في كل موقع.
عنوان ورقة GNNWR:
https://doi.org/10.1080/13658816.2019.1707834

على وجه التحديد، يأخذ SWNN متجه المسافة من كل نقطة عينة إلى نقاط عينة أخرى كمدخل ويخرج سلسلة من الأوزان المكانية في هذا الموضع، أي مصفوفة الأوزان W.وهذا يتيح التعبير عن التباين المكاني.

من أجل الحصول على قدرة تعميم قوية على عينات أصغر وجعل تدريب النموذج يتقارب بشكل أسرع، نستخدم طريقة GNNWR.يتم ضرب الأوزان الناتجة عن SWNN بمعاملات الانحدار العالمية التي تم الحصول عليها بواسطة OLS مسبقًا.تم تشكيل معاملات الانحدار للتباين المكاني.

ومن معادلة الانحدار في الشكل أعلاه، يمكن ملاحظة أن معادلة الانحدار تتكون من المتغيرات المستقلة ومعاملات الانحدار العالمية ومعلمات التعديل المكانية غير الثابتة عند نقاط المراقبة. وبناءً على ذلك، قمنا بإنشاء نموذج انحدار مكاني يعتمد على الشبكات العصبية لحل عملية عدم الثبات المكاني.

تحسين مقاييس القرب المكاني باستخدام الشبكات العصبية

كما ذكرنا سابقًا، يأخذ SWNN متجه المسافة من كل نقطة عينة إلى نقاط عينة أخرى كمدخل. في هذه العملية، نستخدم عادةً المسافة الإقليدية.على سبيل المثال، يتم استخدام طول الخط الذي يربط بين نقطتين في الفضاء كمقياس للمسافة.هذه هي الطريقة الأكثر بديهية والأسهل للفهم للتعبير عن المسافة.

ومع ذلك، في البيئات الحضرية،تتأثر المسافة الإقليدية بالظروف الطبيعية وحركة المرور، ومن الصعب أن تعكس القرب المكاني الفعلي.على سبيل المثال، إذا كنت تريد الذهاب إلى نهر تشيانتانغ على الجانب الآخر، وإذا لم تتمكن من استخدام جسر الطريق السريع، فسوف تحتاج إلى اتخاذ طريق بديل كبير للعبور. في هذه الحالة، على الرغم من أن المسافة المستقيمة بين النقطتين قريبة جدًا، إلا أنهما بعيدتان جدًا في الفضاء الفعلي، ولا يمكن للمسافة الإقليدية أن تعكس قربهما المكاني بشكل كامل.

في العالم الحقيقي، الذي تحده المناظر الطبيعية والأشياء التي صنعها الإنسان، يعتمد تبادل الأشخاص والمواد في كثير من الأحيان على شبكات النقل البري.تعتبر مسافة شبكة الطرق (ND) ومدة السفر (TD) أيضًا مقاييس مناسبة للقرب المكاني.

لكن،بسبب قواعد المرور والقيود المفروضة على سعة الطريق،إن القرب المكاني الذي يمثله نفس طول مسافة شبكة الطرق ونفس وقت السفر ليس هو نفسه. على سبيل المثال، إذا قمت بالقيادة لمدة 13 دقيقة نفسها، فبسبب حد السرعة في الحرم الجامعي، يمكنك القيادة لمسافة قصيرة فقط، ولكن إذا كنت على جسر علوي، فيمكنك القيادة لمسافة طويلة.

لذلك، إذا تم استخدام مقياس قرب مكاني واحد، فسوف تكون هناك بعض القيود. لذلك،نحاول إنشاء دالة دمج المسافة التي تربط مقاييس المسافة المتعددة معًا لتمثيل القرب المكاني بشكل مثالي.

وفقًا للمعادلة أعلاه، نقوم بربط عدة "مسافات" بين نقطتين لتشكيل قيمة أفضل وأكثر دقة تمثل القرب المكاني الحقيقي بين النقطتين.

ولكن هناك مشكلة أيضًا في هذه المعادلة. fsp هو تمثيل للمسافة التي يجب توحيدها في أبعاد متعددة مختلفة. على سبيل المثال، وحدات زمن السفر والمسافة الإقليدية مختلفة، وقد تكون أوامر الحجم مختلفة تمامًا أيضًا. إن الاعتماد فقط على الوظائف العادية لا يمكنه تحقيق تأثير الاقتران بشكل كامل. في هذا الصدد،لقد قمنا ببناء شبكة عصبية قريبة مكانيًا SPNN،قم برسم هذه المسافات في مقياس القرب المكاني الموحد.

وبعد ذلك، من خلال تدريب هذه الشبكة العصبية، يمكن تحويل حساب وظيفة محددة إلى عملية تركيب تعتمد على البيانات. هذه هي فكرتنا لاستخدام الشبكات العصبية لتحسين القرب المكاني.

ربط شبكتين عصبيتين لتشكيل osp-GNNWR

نظرًا لأن القرب المكاني هو مفهوم مجرد وليس له قيمة حقيقية، على سبيل المثال، عند وجود نقطة أ ونقطة ب، لا يمكننا القول إن القرب المكاني بين أ و ب هو قيمة محددة x. وهذا يجعل من المستحيل تحديد دالة الخسارة لـ SPNN وبالتالي تدريبها.

حلنا هو،يتم استخدام مخرجات SPNN بشكل مباشر كمدخل للمسافة لـ GNNWR، ويتم توصيل الشبكتين العصبيتين لتشكيل كل موحد، والذي نسميه مقياس القرب المكاني الأمثل للانحدار المرجح للشبكة الجغرافية (osp-GNNWR).

وفقًا لهذا النموذج، يمكننا تدريب الشبكة بأكملها مباشرةً من خلال خطأ قيمة تقدير العينة، واستخدام خطأ القيمة المجهزة والقيمة المضافة للمتغير التابع النهائي y كدالة خسارة لتدريب الشبكة مباشرةً. تم تدريب الشبكة بأكملها، وتم تدريب SPNN أيضًا في نفس الوقت، وبالتالي حل مشكلة SPNN وإكمال مهمة الانحدار.

وباستخدام أسعار المساكن في ووهان كمثال، يقدم osp-GNNWR تفسيرا جديدا للتباين المكاني لأسعار المساكن.

إذا أخذنا أسعار المساكن في ووهان كمثال،لقد قمنا باختيار 968 من بيانات معاملات الإسكان المستعمل المستقلة في ووهان وقمنا بتقسيمها إلى مجموعة تدريب ومجموعة اختبار بنسبة 85:15.من هذه البيانات، اخترنا 10 متغيرات مستقلة في ثلاث فئات باستخدام طريقة السعر المميزة المستخدمة عادة في نمذجة أسعار المساكن، بما في ذلك المعلومات الأساسية لهذه المنازل، والمرافق الداعمة المحيطة، وراحة النقل، وما إلى ذلك. وعلى هذا الأساس، اخترنا المسافة الإقليدية ووقت السفر كمسافة إدخال لـ SPNN لبناء نموذج osp-GNNWR.

بالنسبة لمقياس القرب المكاني الأمثل، كما هو موضح في الشكل أدناه، يمثل لون كل نقطة في الشكل الفرق المتبقي لنتيجة التجهيز؛ اللون البرتقالي يعني أن تأثير التركيب لـ osp-GNNWR أفضل من نموذج GNNWR الأصلي؛ يمثل الخط الفرق بين القرب المكاني الأمثل والمسافة الإقليدية.

كما هو موضح في الشكل أ، في منطقة الحافة الحضرية، يكون الفرق بين OSP والمسافة الإقليدية كبيرًا، وبسبب تأثير بنية شبكة الطرق، يوجد فرق اتجاهي معين؛ على وجه الخصوص، يمكننا أن نجد فرقًا أقل في اتجاه السهم الأحمر، والذي يرجع أساسًا إلى أن هذا الاتجاه يتزامن مع الطريق السريع الدائري الثاني لمدينة ووهان.ويرجع ذلك إلى الاختلافات الصغيرة في المسافة الإقليدية ووقت السفر المستخدم لبناء OSP.

يوضح الشكل ب أنه في المنطقة المركزية للمدينة، وبفضل وسائل النقل المتطورة، بغض النظر عن الاتجاه الذي تذهب إليه، فإن القرب المكاني في الاتجاهات المختلفة متوازن نسبيًا.لذلك، فإن الفرق بين مسافة osp والمسافة الإقليدية يظهر توزيع دائرة متحدة المركز أكثر انتظامًا.

من خلال هذه الاختلافات بين OSP والمسافة الإقليدية،لقد تمكنا أيضًا من إثبات الأهمية العملية لتحسين مقياس القرب المكاني.

وبناءً على نتائج نمذجة أسعار المساكن، يمكننا مناقشة التباين المكاني لمعاملات الانحدار بشكل أكبر، مثل دراسة تأثير المسافة الجامعية على أسعار المساكن.

كما هو موضح في الشكل أدناه، فإن معلمات UA في وسط منطقة هونغشان في ووهان أعلى بكثير من تلك الموجودة في المناطق الأخرى.ويشير هذا إلى أن الجامعة لها تأثير إيجابي على أسعار المساكن في المنطقة.بمعنى آخر، كلما اقتربت المنطقة من المؤسسة التعليمية، كلما ارتفعت أسعار المساكن. علاوة على ذلك، ساهمت هذه الجامعات ومؤسسات البحث في توفير بيئة معيشية أفضل وخلق سوق إيجار أكثر ازدهارًا.

النماذج الصغيرة لها أهمية كبيرة أيضًا

ولم نستخدم نماذج كبيرة في البحث المذكور أعلاه. على الرغم من أن نماذج الشبكات العصبية الكبيرة ونماذج الشبكات العميقة وما إلى ذلك تحظى بشعبية كبيرة الآن، إلا أن النماذج الصغيرة لا تزال تتمتع بأهمية عملية. في حالة عدم وجود قوة حسابية كافية أو عينات غنية من البيانات، فإن تصميم نموذج صغير وجميل يمكن أن يكون بمثابة مساعدة كبيرة في حل بعض المشاكل.

وأخيرا، هناك بعض المراجع. إذا كنت مهتمًا، فيمكنك أيضًا التحقق منها.

دعوة إلى العمل

HyperAI (hyper.ai) هو محرك بحث أكبر في الصين في مجال علوم البيانات. لقد ركزت منذ فترة طويلة على أحدث نتائج الأبحاث المتعلقة بالذكاء الاصطناعي للعلوم وقامت بتفسير أكثر من 100 ورقة أكاديمية في المجلات العلمية المرموقة.

نرحب بمجموعات البحث والفرق التي تجري أبحاثًا واستكشافات حول الذكاء الاصطناعي للعلوم بالاتصال بنا لمشاركة أحدث نتائج أبحاثهم، والمساهمة في مقالات تفسيرية متعمقة، والمشاركة في عمود البث المباشر Meet AI4S. هناك المزيد من الطرق للترويج لـ AI4S في انتظارنا لاستكشافها معًا!

إضافة WeChat: HyperaiXingXing (معرف WeChat: Hyperai01)