HyperAI

Prenant Comme Exemple Le Prix De 1 700 Logements Résidentiels À Shenzhen, Le Laboratoire SIG De L'université Du Zhejiang Utilise Le Mécanisme D'attention Pour Exploiter Les Caractéristiques Du Contexte Géographique Et Améliorer La Précision De La Régression Spatiale Non Stationnaire.

特色图像

La régression pondérée géographiquement (GWR) est une méthode statistique largement utilisée dans l'analyse géospatiale pour capturer la non-stationnarité spatiale (c'est-à-dire l'hétérogénéité spatiale) des phénomènes géographiques. Le GWR traditionnel attribue des pondérations à chaque point d’observation pour refléter son influence sur les paramètres de régression. Ces pondérations sont généralement calculées en fonction de la distance spatiale (comme la distance euclidienne), selon le principe « plus la distance est proche, plus l'influence est grande ». Cependant,Cette approche basée sur la distance ignore la similarité contextuelle complexe des phénomènes géographiques.Par exemple, les similitudes dans les facteurs socioéconomiques ou les caractéristiques environnementales peuvent avoir des effets importants sur le modèle de régression. Par exemple, dans un environnement urbain, deux zones éloignées peuvent présenter des caractéristiques de prix de logement similaires en raison de facteurs socioéconomiques ou environnementaux similaires tels que l’accessibilité aux transports et la structure démographique.

Pour résoudre ce problème,Des chercheurs du laboratoire clé SIG provincial du Zhejiang ont proposé un modèle d'apprentissage en profondeur basé sur le mécanisme d'attention, la régression pondérée géographiquement par le contexte-attention (CatGWR).Le modèle introduit un mécanisme d’attention pour combiner la distance spatiale et la similarité contextuelle entre les échantillons afin d’estimer plus précisément la non-stationnarité spatiale. Cette innovation offre une nouvelle perspective pour la modélisation géospatiale, en particulier lorsqu’il s’agit de phénomènes géographiques complexes, et peut mieux saisir l’hétérogénéité spatiale et les influences situationnelles.

Les résultats associés ont été publiés dans l'International Journal of Geographical Information Science sous le titre « Utilisation d'une architecture basée sur l'attention pour incorporer la similarité de contexte dans l'estimation de la non-stationnarité spatiale ».

Points saillants de la recherche :

* Le modèle CatGWR introduit un mécanisme d'attention pour calculer la similarité contextuelle entre les échantillons, ce qui peut éviter efficacement les interférences de bruit dans les caractéristiques contextuelles et obtenir une expression de similarité plus précise.

* Le modèle CatGWR présente des améliorations significatives de précision sur les ensembles de données simulés et empiriques et fournit des directions d’interprétation plus détaillées.

Adresse du document :
https://doi.org/10.1080/13658816.2025.2456556
Adresse open source du projet :
https://github.com/yorktownting/CatGWR

Ensemble de données : Combinaison d'expériences de simulation et de cas réels

Cet article vérifie l’efficacité du modèle CatGWR à travers des expériences de simulation et des études de cas réelles.Les expériences de simulation ont utilisé deux ensembles de données synthétiques 64×64 (S1 et S2), concevant des scénarios avec une hétérogénéité contextuelle et uniquement une hétérogénéité spatiale, respectivement.Ces ensembles de données construisent des relations de régression à travers des propriétés situationnelles simulées telles que l'hétérogénéité spatiale et les caractéristiques de distribution aléatoire, fournissant ainsi un environnement expérimental contrôlable pour l'évaluation des performances du modèle.

L’étude de cas actuelle prend comme exemple les données sur les prix de l’immobilier à Shenzhen, en Chine.Exemple typique de l’urbanisation rapide de la Chine, les prix de l’immobilier à Shenzhen présentent une hétérogénéité spatiale significative. Les données de recherche comprennent des échantillons de prix des logements de 1 776 communautés résidentielles et 7 variables indépendantes liées aux prix des logements (telles que l'année de construction, les frais de gestion, le taux de verdissement, etc.). En outre, l’étude a également introduit des données sur les passagers des taxis en 6 dimensions comme caractéristiques contextuelles. Ces données peuvent refléter la dynamique urbaine et les modèles d’activité humaine, fournissant des informations spatiales et contextuelles riches pour le modèle.

Architecture du modèle : régression pondérée géographiquement pilotée par l'attention contextuelle

Le modèle CatGWR utilise un mécanisme d’attention additif pour calculer la similarité du contexte géographique et le combine avec des pondérations de distance spatiale.Le modèle est divisé en trois modules : module préprocesseur, module amplificateur et module de régression.Comme le montre la figure suivante :

Conception structurelle du CatGWR

(a) Module de prétraitement :Responsable de l'extraction des variables dépendantes, des variables indépendantes et des caractéristiques contextuelles des données d'entrée, et du calcul de la matrice de pondération spatiale et de la matrice de connectivité spatiale entre chaque échantillon et son voisinage.

(b) Module d'amplification :Élargir le champ réceptif du modèle et améliorer l’utilisation des informations de voisinage par le modèle.

(c) Module de régression :La similarité contextuelle entre les échantillons est calculée via le mécanisme d'attention et est combinée avec la matrice de pondération spatiale pour obtenir les pondérations spatiaux contextualisées. Le perceptron multicouche (MLP) est utilisé pour convertir les poids spatiaux contextualisés en coefficients de régression, réalisant ainsi l'estimation de la non-stationnarité spatiale.

Conclusion expérimentale : révéler la non-stationnarité spatiale des déterminants des prix de l'immobilier à Shenzhen

Cet article vérifie l’efficacité du modèle CatGWR à travers des expériences de simulation et des recherches empiriques sur les prix de l’immobilier à Shenzhen.Dans l'expérience de simulation, nous avons d'abord simulé et généré des variables contextuelles de quatre scénarios géographiques, et utilisé les variables contextuelles générées pour construire davantage deux ensembles de données simulées : S1 (les variables contextuelles ont participé à la génération de l'ensemble de données dans le cadre des coefficients) et S2 (les variables contextuelles n'étaient pas pertinentes pour la relation de régression et sont devenues l'entrée de bruit dans CatGWR). Les résultats expérimentaux montrent que :

* Dans le scénario scénario (S1),CatGWR peut résoudre plus précisément la similarité des scénarios et la coupler efficacement à la proximité spatiale, surpassant considérablement les modèles existants tels que GWR, MGWR, CGWR et GNNWR.

* Dans le scénario non contextualisé (S2),Même si des « variables de contexte » qui ne sont pas pertinentes pour l’ensemble de données sont introduites comme bruit, en raison de la robustesse du mécanisme d’attention utilisé par CatGWR, ses performances ne sont toujours pas inférieures au modèle GWR traditionnel.

Résultats des tests comparatifs de CatGWR sur des ensembles de données simulés

Sur l’ensemble de données sur les prix des logements à Shenzhen, le modèle CatGWR démontre encore davantage sa supériorité.Par rapport aux modèles existants, la valeur R² de CatGWR sur l'ensemble d'entraînement est passée de 0,853 à 0,920, et la valeur R² sur l'ensemble de prédiction est passée de 0,717 à 0,764, et le RMS E et le MAE ont diminué respectivement de 28% et 26%.

aussi,Le modèle CatGWR révèle également la non-stationnarité spatiale des déterminants des prix de l’immobilier à Shenzhen.Par exemple, près de la baie de Shenzhen, en raison de l’influence des résidents qui font la navette entre Shenzhen et Hong Kong grâce au corridor occidental Shenzhen-Hong Kong, l’impact du nombre de places de stationnement sur les prix des logements est plus important que dans d’autres zones. Dans le même temps, la caractéristique de « distance similaire mais poids différent » des pondérations spatiales situationnelles entre les échantillons reflète également les caractéristiques de la construction urbaine et du zonage à Shenzhen. Cela montre que CatGWR peut capturer efficacement l’impact de l’hétérogénéité spatiale et de la similarité des scénarios sur les prix des logements.

Différences dans les pondérations basées sur des scénarios et les caractéristiques de construction urbaine et de zonage de la ville de Shenzhen qui s'y reflètent

* Différences urbaines-rurales causées par la construction de zones économiques spéciales (pondérations AE > AD, AC > AB à des distances physiques similaires)

* Différences dans les types d'utilisation du sol (ville satellite-zone pittoresque) (FH > FL, FG > FL)

Le modèle CatGWR combine avec succès la similarité de scène avec la proximité spatiale en introduisant le mécanisme d'attention, améliorant considérablement la précision et la robustesse de la modélisation de la non-stationnarité spatiale.Ce modèle fonctionne non seulement bien dans les données simulées, mais démontre également de fortes capacités d'ajustement dans les applications pratiques, fournissant de nouvelles idées et méthodes pour la modélisation des processus géographiques.

Utiliser les prévisions des prix de l'immobilier pour expliquer scientifiquement les processus géographiques

Avril 2024L'équipe de recherche du laboratoire SIG provincial du Zhejiang a également publié un article sur le même domaine de recherche dans l'International Journal of Geographical Information Science.La métrique de proximité spatiale optimisée par le réseau neuronal est en outre combinée avec la méthode de régression pondérée du réseau neuronal géographique (GNNWR) pour construire le modèle osp-GNNWR, qui réalise la formation du réseau neuronal en résolvant la relation de régression spatiale non stationnaire entre les variables dépendantes et les variables indépendantes.
Lien vers l'article :
https://www.tandfonline.com/doi/full/10.1080/13658816.2024.2343771

Cliquez pour voir le rapport complet : Le laboratoire SIG de l'université du Zhejiang a proposé le modèle osp-GNNWR : décrire avec précision les processus spatiaux complexes et les phénomènes géographiques

Par coïncidence, cette étude a utilisé les données immobilières de Wuhan comme exemple de recherche et de vérification. Les résultats expérimentaux ont montré que le modèle osp-GNNWR présente des avantages potentiels pour décrire l’hétérogénéité spatiale des processus géographiques du monde réel.

Ding Jiale, doctorant en télédétection et systèmes d'information géographique à l'Université du Zhejiang, est l'auteur de l'étude.Il a déclaré un jour, lors d'une séance de partage universitaire en ligne : « En tant qu'explorateur de la science géographique, si le modèle que nous élaborons ne peut que prédire les prix de l'immobilier, alors de tels résultats sont, à mon avis, ennuyeux. Notre objectif est d'utiliser la série de coefficients de régression produits par ces modèles, qui varient selon la localisation spatiale, pour fournir des explications scientifiques raisonnables des processus ou des tendances géographiques. Ce type de recherche est plus pratique. »

Il est vrai que la recherche en sciences de la terre peut être cachée parmi les gratte-ciel de la ville ou naviguer au loin au sommet des montagnes, des rivières, des lacs et des mers, mais en fin de compte, tout cela se fera sur cette terre, aidant les gens à mieux comprendre les processus géographiques et à explorer la signification des phénomènes géographiques. Ces dernières années, avec les progrès continus de la technologie d’observation, les données spatio-temporelles dans le domaine des sciences de la Terre ont connu une croissance explosive, ce qui a encore favorisé la mise en œuvre de technologies émergentes telles que l’IA dans le domaine des sciences de la Terre.

Le laboratoire clé SIG provincial du Zhejiang est un pionnier de la recherche interdisciplinaire entre l'IA et les sciences de la Terre.En combinant le concept de régression géographique pondérée traditionnelle avec la technologie des réseaux neuronaux, une série de modèles innovants sont proposés, notamment la régression géographique pondérée par les réseaux neuronaux (GNNWR) et la régression géographique spatiotemporelle pondérée par les réseaux neuronaux (GTNNWR).

Depuis la publication du premier article, une série de méthodes telles que GNNWR et GTNNWR ont attiré beaucoup d’attention et ont été largement utilisées dans de nombreux domaines tels que l’océanographie, la géographie, les sciences atmosphériques et la géologie. L’équipe a publié plus de 30 articles connexes. Dans le même temps, les résultats pertinents apportent également inspiration et éclaircissement à d’autres équipes du secteur. De nombreuses équipes externes utilisent des idées de modélisation ou des architectures techniques similaires pour mener des recherches, ce qui fait précisément le charme de la recherche open source.

Adresse open source du GNNWR :

https://github.com/zjuwss/gnnwr