التنبؤ بدقة بأسعار المساكن في ووهان! اقترح مختبر نظم المعلومات الجغرافية بجامعة تشجيانغ نموذج Osp-gnnwr: وصف دقيق للعمليات المكانية المعقدة والظواهر الجغرافية

يشكل الإسكان جزءًا مهمًا من رفاهية الإنسان والتنمية الاجتماعية، وقد حظيت تقلبات أسعار المساكن باهتمام واسع النطاق من المجتمع. الصين بلد ذو امتداد جغرافي واسع جدًا. حتى في نفس المنطقة القضائية لنفس المدينة، فإن المنازل في المناطق المختلفة سيكون لها أسعار سكنية مختلفة بسبب الاختلافات في البيئة المجتمعية والمناطق المدرسية والشركات الداعمة وعوامل أخرى. ومن ثم فإن أحد المواضيع الساخنة في دراسة أسعار المساكن هو التمايز المكاني وآلية التأثير، والتي يطلق عليها "التباين المكاني".
في السنوات الأخيرة، أصبحت الاختلافات المكانية في أسعار المساكن كبيرة بشكل متزايد، ولم تعد طريقة قياس المسافة الواحدة كافية لالتقاط "التباين المكاني" لأسعار المساكن في بيئة جغرافية معقدة. وخاصة في المدن الكبرى مثل ووهان، فإن عوامل مثل السمات الطبيعية (مثل الأنهار والبحيرات) والبنية الأساسية الحضرية (مثل الجسور والأنفاق وشبكات الطرق متعددة الطبقات) لها تأثير معقد على أسعار المساكن.تواجه نماذج الانحدار الموزون جغرافيًا التقليدية (GWR) تحديات في قياس القرب المكاني.
وفي هذا السياق، نشر باحثون من مختبر نظم المعلومات الجغرافية بجامعة تشجيانغ ورقة بحثية بعنوان "نموذج الشبكة العصبية لتحسين مقياس القرب المكاني في نهج الانحدار المرجح جغرافيًا: دراسة حالة حول أسعار المساكن في ووهان" في المجلة الدولية لعلوم المعلومات الجغرافية، وهي مجلة معروفة في مجال علوم المعلومات الجغرافية.
قدمت هذه الدراسة بشكل مبتكر طريقة الشبكة العصبية لإجراء اقتران غير خطي على مقاييس القرب المكاني المتعددة (مثل المسافة الإقليدية، ووقت السفر، وما إلى ذلك) بين نقاط المراقبة للحصول على مقياس القرب المكاني الأمثل (OSP)، وبالتالي تحسين دقة التنبؤ بالنموذج لأسعار المساكن.
لحل مشكلة عدم قدرة "القرب المكاني" المجرد على إنشاء وظائف الخسارة وصعوبة تدريب الشبكات العصبية،وتجمع هذه الدراسة أيضًا بين OSP وطريقة الانحدار المرجح للشبكة العصبية الجغرافية (GNNWR).تم بناء نموذج osp-GNNWR لتحقيق تدريب الشبكة العصبية من خلال حل العلاقة الانحدارية المكانية غير الثابتة بين المتغيرات التابعة والمتغيرات المستقلة.
أبرز الأبحاث:
- ومن خلال تقديم مقياس القرب المكاني الأمثل ودمجه في بنية الشبكة العصبية، يتم تحسين إمكانية تطبيق الانحدار المرجح جغرافيًا في دراسة التوزيع المكاني للعمليات الجغرافية مثل أسعار المساكن بشكل فعال.
- ومن خلال دراسة مجموعات البيانات المحاكاة والحالات التجريبية لأسعار المساكن في ووهان، ثبت أن النموذج المقترح في الورقة البحثية يتمتع بأداء عالمي أفضل ويمكنه وصف العمليات المكانية المعقدة والظواهر الجغرافية بدقة أكبر.
- يفتح هذا آفاقًا جديدة لدراسة كيفية تخصيص مقاييس القرب المكاني لتحسين أداء نماذج الانحدار الجغرافي المكاني المختلفة

عنوان الورقة:
https://www.tandfonline.com/doi/full/10.1080/13658816.2024.2343771
يجمع مشروع المصدر المفتوح "awesome-ai4s" أكثر من 100 تفسير لورقة AI4S ويوفر أيضًا مجموعات بيانات وأدوات ضخمة:
https://github.com/hyperai/awesome-ai4s
مجموعة البيانات: تُستخدم مدينة ووهان كمنطقة بحث نموذجية
مجموعة بيانات محاكاة
لتقييم دقة تركيب نموذج osp-GNNWR، قام الباحثون بإنشاء مجموعة بيانات محاكاة غير متجانسة مكانيًا بحجم 64×64. لا ينعكس التباين المكاني لمجموعة البيانات المحاكاة في المسافة المستقيمة فحسب، بل يُظهر أيضًا خصائص التوزيع المكاني التي تحددها المسافة غير الإقليدية، والتي يمكن أن توضح فعالية OSP.
مجموعة البيانات الفعلية
تقع مدينة ووهان، عاصمة مقاطعة هوبي، في وسط الصين، عند التقاء نهر الهان ونهر اليانغتسي. تتمتع مدينة ووهان بمناخ شبه استوائي رطب مع هطول أمطار غزيرة والعديد من الأنهار والبحيرات والبرك، مما يجعل تقييم القرب المكاني أمرًا صعبًا. وباعتبارها أكبر مدينة وأكثرها كثافة سكانية في وسط الصين، تتمتع ووهان أيضًا بسوق عقاري مزدهر، مما يوفر بيانات كافية لبناء نموذج شامل لديناميكيات العقارات المحددة في ووهان.

تحقيقا لهذه الغاية،قام الباحثون بتجميع مجموعة بيانات تحتوي على 968 عينة عقارية مختلفة.تأتي هذه البيانات من سجلات معاملات الإسكان المستعمل في ووهان في عام 2019، ومصدر البيانات هو Anjuke (https://wuhan.anjuke.com). تم تنظيف جميع هذه السجلات، وتم استبعاد أنواع الممتلكات الخاصة (مثل الفيلات)، وتم ضمان جودة البيانات.
هندسة النموذج: تقديم مقياس القرب المكاني الأمثل ودمجه في شبكة عصبية
يتم تقسيم بناء نموذج osp-GNNWR إلى خطوتين:
الخطوة 1: الحصول على مقياس القرب المكاني الأمثل (OSP)
من أجل الحصول على قياس أكثر دقة للقرب المكاني في التحليل الجغرافي المعقد، قامت هذه الدراسة بدمج طرق قياس المسافة المتعددة، بما في ذلك المسافة الإقليدية، ومسافة مانهاتن، ووقت السفر، لتحسين القرب المكاني (OSP). وبهذه الطريقة، يمكن لقياس القرب المكاني الأمثل أن يعكس بشكل أفضل العوامل المؤثرة المختلفة في العلاقات المكانية المعقدة، وبالتالي تحسين ملاءمة نموذج الانحدار المكاني وقوته التفسيرية.
الخطوة 2: من خلال الجمع بشكل أكبر بين OSP وGNNWR، اقترح الباحثون نموذج osp-GNNWR.كما هو موضح في الشكل التالي:

على وجه التحديد، فإن إجراءات التدريب والتحقق من صحة نموذج osp-GNNWR هي كما يلي:

الخطوة 1:استخراج المتغيرات التابعة والمتغيرات المستقلة لبناء نماذج الانحدار؛
الخطوة 2:يتم تقسيم مجموعة البيانات بشكل عشوائي إلى مجموعة تدريب ومجموعة تحقق ومجموعة اختبار بنسب مناسبة؛
الخطوة 3:يتم حساب مسافات العينة كمعلومات مكانية في نموذج osp-GNNWR؛
الخطوة 4:باستخدام متغيرات الإدخال والمعلومات المكانية، يتم إنشاء نموذج osp-GNNWR بما في ذلك بنية الشبكة والمعلمات الفائقة؛
الخطوة 5:احصل على بيانات دفعية صغيرة من مجموعة التدريب، وقم بالتدريب باستخدام خوارزمية الانحدار المتدرج، وقم بتقييم مدى ملاءمة البيانات، مثل استخدام خطأ المربع المتوسط (MSE) كدالة خسارة؛
الخطوة 6:تقييم ما إذا كان العصر الحالي مكتملًا؛ إذا لم يكن الأمر كذلك، ارجع إلى الخطوة 5.
الخطوة 7:قم بتقييم دالة الخسارة في مجموعة التحقق لتحديد ما إذا كان هناك ملاءمة زائدة؛ إذا تم تحسين الخسارة مقارنة بأفضل نتيجة سابقة، فاحتفظ بالنموذج المتفوق الجديد؛ وإلا، قم بزيادة عدد التسامح مع الإفراط في التجهيز؛
الخطوة 8:تقييم ما إذا كان قد تم الوصول إلى التسامح مع الإفراط في التجهيز أو الحد الأقصى لعدد العصور (الحد الأقصى للعصر)؛ عندما يتم الوصول إلى الحد الأقصى، يتوقف التدريب ويتم استخدام مجموعة الاختبار لتقييم أحدث طراز متفوق؛ بخلاف ذلك، استمر في التكرار من الخطوة 5.
من خلال الخطوات المذكورة أعلاه، يمكن للباحثين تدريب نموذج osp-GNNWR والتحقق منه بشكل فعال لالتقاط وشرح التباين في العلاقات المكانية المعقدة وتحسين دقة وموثوقية النموذج.
نتائج البحث: نموذج osp-GNNWR يتمتع بأداء عالمي أفضل
أولاً، دعونا نلقي نظرة على نتائج التحليل استنادًا إلى مجموعة البيانات المحاكاة. في مجموعة من مجموعات البيانات المحاكاة القائمة على المسافة الإقليدية والمسافة من الدرجة Z، استخدم الباحثون نماذج بما في ذلك OLS وGWR وGNNWR وosp-GNNWR للمقارنة. وتظهر النتائج في الجدول التالي:

- R²: مقياس لمدى إمكانية تفسير مقدار التباين في متغير واحد (المتغير التابع) من خلال التباين في متغير واحد أو أكثر آخر (المتغيرات المستقلة). تُستخدم هذه القيمة غالبًا في تحليل الانحدار الخطي لتقييم مدى ملاءمة النموذج. 0% يعني أن النموذج لا يستطيع تفسير أي تغير في متغير الاستجابة حول متوسطه، أي أنه لا توجد علاقة تقريبًا بين النموذج والبيانات؛ 100% يعني أن النموذج يمكنه تفسير جميع تغيرات متغير الاستجابة حول متوسطه، أي أن النموذج يناسب البيانات بشكل مثالي.
- RMSE (خطأ الجذر التربيعي المتوسط): يستخدم لقياس الانحراف بين القيمة الملاحظة والقيمة الحقيقية. كلما كانت القيمة أصغر، كلما زادت دقة التنبؤ للنموذج.
- MSE (متوسط الخطأ المطلق): يستخدم لقياس الانحراف المطلق المتوسط بين القيمة المتوقعة للنموذج والقيمة الفعلية. كلما كانت القيمة أصغر، كلما زادت دقة التنبؤ للنموذج.
سواء على مجموعة بيانات التدريب أو مجموعة بيانات الاختبار، فإن نموذج osp-GNNWR يحتوي على R² أعلى، وقيمة RMSE أقل، وقيمة MSE أقل، وبالتالي يُظهر أداءً أفضل. تُظهر نتائج تجارب المحاكاة هذه أن شبكة SPNN المستخدمة في نموذج osp-GNNWR تتمتع بقدرة تعميم ممتازة وتأثير تركيب دقيق للغاية عند معالجة مسافات الإدخال. لذلك، بالمقارنة مع الطريقة التقليدية التي تعتمد فقط على المسافة الإقليدية،يتمتع نموذج osp-GNNWR بمزايا محتملة في تصوير التباين المكاني للعمليات الجغرافية في العالم الحقيقي.
والثاني هو أداء نموذج osp-GNNWR استنادًا إلى بيانات أسعار المساكن الفعلية في ووهان. يوضح الجدول التالي نتائج مقارنة الأداء لنماذج OLS وGWR وGNNWR وosp-GNNWR:

على نحو مماثل، يتمتع نموذج osp-GNNWR بقيمة R² أعلى، وقيمة RMSE أقل، وقيمة MSE أقل في كل من مجموعات البيانات التدريبية والاختبارية، وبالتالي يُظهر أداءً أفضل.
ومن الجدير بالذكر أنه بالمقارنة مع GNNWR(TD)، فإن نموذج osp-GNNWR يحسن R² لمجموعة بيانات الاختبار من 0.737 إلى 0.793، ويقلل RMSE من 0.168 إلى 0.149 وMAE من 0.125 إلى 0.109. وتشير هذه النتائج إلى أنيؤدي تكامل OSP إلى تحسين أداء التجهيز والتنبؤ لنموذج osp-GNNWR.مما يجعلها النهج الأكثر فعالية بين النماذج التي تمت دراستها.
- GNNWR(TD): نموذج GNNWR يستخدم وقت السفر كمقياس للقرب.
وعلى وجه التحديد، في المناطق ذات المناظر الطبيعية والبنية الأساسية المعقدة، مثل الضفة الغربية لبحيرة تانغشون في منطقة جيانغشيا، وشاطئ بحيرة هوغونغ في منطقة كايديان، وملتقى نهر الهان ونهر اليانغتسي، وفي مناطق التنمية الناشئة ذات شبكات الطرق السريعة المتطورة والاختلافات الكبيرة بين القرب المكاني الفعلي والمسافة المادية، مثل منطقة هونغشان ومنطقة شينتشو،إن المتبقي من نموذج osp-GNNWR أصغر بكثير من المتبقي في النماذج الأخرى، مما يدل على دقة تنبؤ أعلى.
بشكل عام، تسلط نتائج هذه الدراسة الضوء على فعالية OSP في تعزيز قدرة نموذج osp-GNNWR على تمثيل التباين المكاني، وبالتالي تعزيز نمذجة العلاقات المكانية المعقدة داخل أسواق العقارات.
يساعد التعلم العميق في حل مشاكل التنبؤ بأسعار المساكن المعقدة
إن استكشاف أسباب وآليات التأثير على التمايز المكاني لأسعار المساكن له أهمية كبيرة في الحفاظ على التطور المستقر لسوق العقارات وتحسين التخطيط الحضري والرضا السكني. ومع ذلك، فإن التنبؤ بأسعار المنازل مسألة معقدة للغاية، وتتضمن العديد من العوامل، مثل الموقع الجغرافي، وسهولة النقل، والمنطقة المدرسية، وعمر المنزل، ونوع المنزل، وما إلى ذلك. غالبًا ما تعتمد الطرق التقليدية على الإحصاءات والتعلم الآلي، لكن هذه الطرق تكافح للتعامل مع الحجم المتزايد وتعقيد البيانات. يتمتع التعلم العميق بقدرات قوية في تعلم الميزات والتصنيف ويمكنه التعامل بشكل أفضل مع مثل هذه المشكلات.
من أجل تحسين دقة التنبؤ بأسعار المساكن، يتم إجراء أبحاث الصناعة بشكل رئيسي في الاتجاهات التالية:
الأول هو نهج النموذج المختلط.وهذا يعني الجمع بين التعلم العميق وأساليب التعلم الآلي التقليدية للاستفادة الكاملة من مزايا كل منهما. على سبيل المثال، يمكن دمج التعلم العميق مع أساليب التعلم الآلي التقليدية مثل آلات الدعم المتجه (SVM) أو الغابات العشوائية لبناء نموذج هجين للتنبؤ بأسعار المساكن.
والثاني هو النظر في بيانات السلاسل الزمنية.وهذا يعني أنه في التنبؤ بأسعار المساكن، بالإضافة إلى النظر في الخصائص الثابتة للمنزل، يمكن أيضًا النظر في بيانات السلاسل الزمنية، مثل أسعار المساكن التاريخية، والمؤشرات الاقتصادية، وما إلى ذلك، ويمكن استخدام أساليب مثل الشبكات العصبية المتكررة (RNN) للتحليل والتنبؤ.

على سبيل المثال،قدم بعض الباحثين طريقة للتنبؤ بأسعار المنازل من خلال سلسلة زمنية ملتوية تعتمد على آلية الاهتمام في براءات اختراع جوجل.قام الباحثون أولاً بمعالجة مجموعة بيانات أسعار المساكن مسبقًا وحصلوا على سلسلة زمنية من العوامل متعددة الأبعاد المتعلقة بأسعار المساكن.
مع الأخذ في الاعتبار العوامل المتعددة الأبعاد التي تؤثر على أسعار المساكن، والتقلبات والتأثيرات على اتجاهات أسعار المساكن، يتم استخدام شبكة عصبية متسلسلة زمنية ملتوية تعتمد على آلية الانتباه للتنبؤ بأسعار المساكن. يتم استخدام شبكة عصبية ملتوية أحادية البعد لمعالجة ميزات العوامل ذات الصلة متعددة الأبعاد للحصول على متجه ميزات متعدد الأبعاد بعد استخراج الميزات الإضافية وتقليل الأبعاد. يتم بعد ذلك إدخال متجه الميزة في نموذج الذاكرة الطويلة الأمد القصيرة الأمد لمعرفة الاتجاه العام الطويل الأمد ومعلومات التبعية المحلية قصيرة الأمد بين الميزات.
تجمع هذه الطريقة بين الاتجاه العام طويل الأجل والمعلومات المحلية قصيرة الأجل للتنبؤ بسلسلة زمنية لأسعار المساكن، وتقلل من تباين التنبؤ بأسعار المساكن، وتحسن قدرة التعميم لطرق التنبؤ بأسعار المساكن القائمة على بيانات سلسلة زمنية متعددة الأبعاد.
ثالثا: تطبيق نظم المعلومات الجغرافية (GIS)دمج التعلم العميق مع أنظمة المعلومات الجغرافية (GIS) لتحليل تأثير عوامل مثل الموقع الجغرافي على أسعار المساكن وتحسين دقة التنبؤ بالنموذج - نموذج osp-GNNWR المذكور أعلاه هو مثال نموذجي.
مع دعم الذكاء الاصطناعي، سيصبح نموذج التنبؤ بأسعار المساكن أكثر موثوقية ودقة. وبناءً على ذلك، تستطيع شركات العقارات تقليل مخاطر الاستثمار؛ يمكن للحكومة التحكم بشكل كامل ودقيق في معلومات الإسكان، وذلك لتنفيذ الإدارة المستهدفة، وخلق بيئة عقارية جيدة بشكل مشترك، ومساعدة الناس على العيش والعمل في سلام ورضا حقيقيين.
مراجع:
1.https://www.tandfonline.com/doi/full/10.1080/13658816.2024.2343771
2.https://mp.weixin.qq.com/s/P4nk5sl2v60Q5DeVrOfWLw
3.https://cloud.baidu.com/article/1892933
4.https://patents.google.com/pate