Petit Modèle, Grande Avancée ! Les Réseaux Neuronaux Voient À Travers L'hétérogénéité Spatiale Et Décrivent Avec Précision Des Phénomènes Géographiques Complexes

Promouvoir l'universalisation de l'IA pour le service social, réduire les barrières de diffusion des résultats de la recherche scientifique des institutions universitaires et fournir une plate-forme de communication à davantage de chercheurs de l'industrie, de passionnés de technologie et d'unités industrielles,HyperAI a planifié la série de diffusions en direct « Meet AI4S ».Invitez des chercheurs ou des unités connexes profondément engagés dans le domaine de l’IA pour la science à partager leurs résultats de recherche, leurs méthodes et leurs idées sous forme de vidéos.
Dans le premier épisode de la série de diffusions en direct « Meet AI4S »,Nous sommes honorés d'avoir invité Ding Jiale, doctorant en télédétection et systèmes d'information géographique de l'Université du Zhejiang,Le Laboratoire clé provincial du Zhejiang des ressources et des systèmes d'information environnementale, où il travaille, a publié un certain nombre de résultats de recherche de grande valeur dans des domaines nationaux de haute technologie tels que les systèmes d'information géographique et terrestre numérique, la télédétection et les systèmes de positionnement global.
Ce partage,Le Dr Ding Jiale a prononcé un discours intitulé « Les réseaux neuronaux fournissent de nouvelles explications à l’hétérogénéité spatiale des prix de l’immobilier ».Il a partagé ses derniers résultats de recherche. Cette étude a en outre combiné une mesure de proximité spatiale (OSP) optimisée par un réseau neuronal avec la méthode de régression pondérée du réseau neuronal géographique pour construire le modèle osp-GNNWR. En résolvant la relation de régression spatiale non stationnaire entre la variable dépendante et la variable indépendante, la formation du réseau neuronal est réalisée, ce qui peut décrire plus précisément les processus spatiaux complexes et les phénomènes géographiques.
Cliquez ici pour voir la rediffusion complète en direct⬇️
https://www.bilibili.com/video/BV14W42197on
HyperAI a compilé et résumé le partage approfondi du Dr Ding Jiale sans violer l'intention initiale.

Promouvoir le développement futur de la science du point de vue de l'interprétabilité des modèles
En tant qu’explorateur de la science géographique, si le modèle que nous élaborons ne peut que prédire simplement les prix de l’immobilier, alors de tels résultats me semblent ennuyeux.Notre objectif est de fournir une explication scientifique raisonnable des processus ou des modèles géographiques en utilisant une série de coefficients de régression produits par ces modèles qui varient en fonction des emplacements spatiaux.Ces recherches sont plus prospectives et plus pratiques. C'est sur la base de cette vision que j'ai choisi le thème « Les réseaux neuronaux fournissent de nouvelles explications à l'hétérogénéité spatiale des prix de l'immobilier » à partager aujourd'hui.
Il y a quelque temps, notre équipe a publié un article de recherche intitulé « Un modèle de réseau neuronal pour optimiser la mesure de la proximité spatiale dans l'approche de régression géographiquement pondérée : une étude de cas sur le prix de l'immobilier à Wuhan » dans l'International Journal of Geographical Information Science, une revue bien connue dans le domaine des sciences de l'information géographique.
Adresse papier:
https://www.tandfonline.com/doi/full/10.1080/13658816.2024.2343771
Dans cette étude, nous avons introduit une méthode de réseau neuronal pour coupler de manière non linéaire plusieurs mesures de proximité spatiale (telles que la distance euclidienne, le temps de trajet, etc.) entre les points d'observation.La mesure de proximité spatiale optimisée (OSP) est obtenue, améliorant ainsi la précision de la prédiction du prix du logement du modèle.
Pour résoudre les problèmes selon lesquels la « proximité spatiale » abstraite ne peut pas construire de fonctions de perte et les réseaux neuronaux sont difficiles à former, nous combinons en outre l'OSP avec la méthode de régression pondérée par réseau neuronal géographique (GNNWR).Le modèle osp-GNNWR a été construit.L'entraînement du réseau neuronal est réalisé en résolvant la relation de régression spatiale non stationnaire entre la variable dépendante et la variable indépendante. En fin de compte, le modèle s’est avéré avoir de meilleures performances globales et décrire plus précisément les processus spatiaux complexes et les phénomènes géographiques.
Ensuite, j’utiliserai ce résultat comme exemple pour partager avec vous le processus spécifique par lequel les réseaux neuronaux fournissent de nouvelles explications à l’hétérogénéité spatiale des prix des logements.
Contexte de la recherche : Les avancées de la recherche scientifique face à un double défi
« L’hétérogénéité spatiale » est un facteur clé à l’origine des fluctuations des prix des logements, mais une seule méthode de mesure de la distance est insuffisante pour saisir « l’hétérogénéité spatiale » des prix des logements dans un environnement géographique complexe ; Le modèle de régression pondéré géographiquement traditionnel (GWR) est également confronté à des défis dans la mesure de la proximité spatiale. C’est en raison de ces facteurs que nous avons choisi de mener cette étude.
Hétérogénéité spatiale : différentes expressions dans différents espaces
Tout d’abord, permettez-moi de vous donner quelques informations générales sur l’hétérogénéité spatiale et la régression pondérée géographiquement.
Le modèle de régression linéaire ordinaire MCO est la méthode statistique la plus couramment utilisée et la plus basique pour déterminer la relation de régression des variables. Il utilise une formule très concise pour décrire la relation entre la variable dépendante et plusieurs variables indépendantes. Comme le montre la figure ci-dessous, y est égal à un terme d’interception plus le produit de plusieurs coefficients de régression et de variables indépendantes.

Lorsque nous appliquons des méthodes statistiques telles que les MCO à la géographie,Il est souvent nécessaire de prendre en compte les caractéristiques spatiales inhérentes à certaines problématiques géographiques.Cela a donné lieu à des recherches connexes sur les statistiques spatiales et la modélisation spatiotemporelle.
Le modèle de régression linéaire ordinaire suppose que le coefficient de régression est indépendant de l’emplacement spatial et temporel des données de l’échantillon, et que le coefficient calculé de la variable indépendante se situe au niveau moyen de la zone d’étude.
mais,La relation de régression dans les processus géographiques réels montrera des différences dans différents emplacements spatiaux.Prenons l’exemple des prix de l’immobilier : les principaux facteurs d’influence d’une maison de même taille dans le centre-ville et dans les banlieues sont différents, de sorte que leurs relations de régression ont également des formes différentes.Nous appelons cette hétérogénéité spatiale caractéristique (non-stationnarité spatiale).

L'hétérogénéité spatiale est une caractéristique inhérente à la description de la relation entre les éléments géographiques et constitue l'expression différentielle de la relation ou de la structure des éléments géographiques dans différents lieux de temps et d'espace. Cela signifie que le mécanisme de génération de données à différents emplacements spatiaux est différent, ce qui se manifestera sous la forme de modèles de régression correspondants, ou les paramètres changeront avec l'emplacement spatial.
Régression pondérée géographiquement : transformation de la proximité spatiale en pondérations via les fonctions de noyau
La régression pondérée géographiquement (GWR) est une méthode de modélisation des processus spatialement hétérogènes proposée par l'universitaire américain A. Stewart Fotheringham.
À partir de la formule de la figure ci-dessous, nous pouvons voir que bien que la forme globale de GWR soit toujours une relation de régression linéaire, son terme d'interception et son coefficient de régression sont devenus une relation de mappage avec la position de coordonnées (ui, vi). C'est-à-dire qu'à différentes positions de coordonnées, sa relation de régression est différente.La relation de régression reflétée par la formule entière changera également avec différentes positions spatiales.

Les coefficients de régression pour GWR sont difficiles à déterminer.La méthode de résolution la plus couramment utilisée aujourd’hui est similaire à la méthode des moindres carrés pondérés, qui utilise une méthode des moindres carrés pondérés pour la résolution.
Dans la formule de la figure ci-dessous, la matrice de pondération diagonale W est utilisée pour pondérer les échantillons, ce qui peut refléter la corrélation spatiale entre les variables indépendantes. Spécifiquement,Les poids entre les échantillons sont calculés en fonction de la proximité spatiale des échantillons.Plus deux points sont proches dans l’espace, plus la corrélation sera forte. Nous lui attribuerons un poids plus important et l’utiliserons pour construire un modèle.

Comment réaliser la conversion de la proximité spatiale au poids ?GWR utilise une fonction noyau, telle que la fonction noyau gaussienne, la fonction noyau bicarrée, etc., pour convertir la proximité spatiale en un poids, réalisant ainsi la construction de l'équation pondérée. Cependant, cette approche présente certaines limites.

Dans le passé, la clé de la modélisation des processus spatialement hétérogènes était de concevoir et de construire la fonction noyau de pondération spatio-temporelle basée sur la mesure de proximité spatio-temporelle, puis d'utiliser la théorie de régression pondérée locale pour établir la fonction de solution cible non stationnaire. En résolvant de manière optimale les critères d’évaluation du modèle, la modélisation géographique des relations spatio-temporelles non stationnaires a été réalisée.
Les recherches existantes sur cette méthode se concentrent également sur l’affinement du champ d’utilisation des fonctions du noyau, puis sur l’établissement d’un modèle de noyau hybride avec plusieurs paramètres de bande passante.Cependant, l’amélioration et le développement de la structure de la fonction noyau elle-même sont ignorés :Par exemple, le système de structure de fonction de noyau existant avec une analyse à paramètre unique comme noyau est relativement simple, et il est difficile d'estimer complètement l'effet complexe de la proximité spatio-temporelle sur les poids spatio-temporels, ce qui entraîne l'incapacité de résoudre avec précision les caractéristiques spatio-temporelles non stationnaires des relations géographiques complexes.
Avec le développement continu du Big Data ces dernières années, nous devrions exploiter pleinement les avantages des données massives dans l’environnement du Big Data et utiliser efficacement la capacité d’ajustement non linéaire des réseaux neuronaux profonds.L’utilisation de réseaux neuronaux pour expliquer l’hétérogénéité spatiale est une solution envisageable au dilemme actuel de développement des méthodes de modélisation des relations spatio-temporelles.
Comment les réseaux neuronaux peuvent-ils être utilisés pour rendre compte de l’hétérogénéité spatiale ?
La fusion de SWNN et GNNWR a une capacité de généralisation plus forte
Auparavant, nous avons proposé un modèle de régression pondéré par réseau neuronal géographique GNNWR, qui utilise un réseau neuronal profond (réseau neuronal pondéré spatial SWNN) pour attribuer une série de poids spatiaux aux échantillons à chaque emplacement.
Adresse du journal GNNWR :
https://doi.org/10.1080/13658816.2019.1707834

Plus précisément, SWNN prend le vecteur de distance de chaque point d'échantillonnage à d'autres points d'échantillonnage comme entrée et génère une série de pondérations spatiaux à cette position, c'est-à-dire la matrice de pondération W.Cela permet l’expression de l’hétérogénéité spatiale.

Afin d'avoir une forte capacité de généralisation sur des échantillons plus petits et de faire converger plus rapidement la formation du modèle, nous utilisons la méthode GNNWR.Les poids produits par SWNN sont multipliés par les coefficients de régression globaux obtenus par la méthode a priori des MCO.Des coefficients de régression pour l’hétérogénéité spatiale ont été formés.
À partir de l’équation de régression de la figure ci-dessus, on peut voir que l’équation de régression se compose de variables indépendantes, de coefficients de régression globaux et de paramètres d’ajustement spatiaux non stationnaires aux points d’observation. Sur cette base, nous avons établi un modèle de régression spatiale basé sur des réseaux neuronaux pour résoudre le processus spatial non stationnaire.
Optimisation des mesures de proximité spatiale à l'aide de réseaux neuronaux
Comme mentionné précédemment, SWNN prend le vecteur de distance de chaque point d'échantillonnage à d'autres points d'échantillonnage comme entrée. Dans ce processus, nous utilisons généralement la distance euclidienne.Par exemple, la longueur de la ligne reliant deux points dans l’espace est utilisée comme mesure de distance.C’est la manière la plus intuitive et la plus facile à comprendre d’exprimer la distance.

Cependant, dans les environnements urbains,La distance euclidienne est affectée par les conditions naturelles et de circulation et il est difficile de refléter la proximité spatiale réelle.Par exemple, si vous souhaitez vous rendre sur l'autre rive de la rivière Qiantang, si vous ne pouvez pas emprunter le pont routier, vous devrez faire un grand détour pour traverser. Dans ce cas, bien que la distance en ligne droite entre les deux points soit très proche, ils sont très éloignés dans l’espace réel, et la distance euclidienne ne peut pas refléter pleinement leur proximité spatiale.
Dans le monde réel, contraint par les paysages naturels et les objets fabriqués par l’homme, les échanges de personnes et de matériaux reposent souvent sur les réseaux de transport routier.La distance du réseau routier (ND) et la durée du trajet (TD) sont également des mesures de proximité spatiale appropriées.
Cependant,En raison des réglementations routières et des restrictions de capacité routière,La proximité spatiale représentée par la même longueur de distance du réseau routier et le même temps de trajet n’est pas la même. Par exemple, si vous conduisez pendant les mêmes 13 minutes, en raison de la limite de vitesse sur le campus, vous ne pouvez parcourir qu'une courte distance, mais si vous êtes sur un viaduc, vous pouvez parcourir une longue distance.
Par conséquent, si une seule mesure de proximité spatiale est utilisée, il y aura certaines limitations. donc,Nous tentons d’établir une fonction de fusion de distance qui couple plusieurs mesures de distance pour représenter de manière optimale la proximité spatiale.

Selon l'équation ci-dessus, nous couplons plusieurs « distances » entre deux points pour former une valeur meilleure et plus précise qui représente la véritable proximité spatiale entre les deux points.
Mais il y a aussi un problème avec cette équation. fsp est une représentation de distance qui doit être unifiée dans plusieurs dimensions différentes. Par exemple, les unités de temps de trajet et de distance euclidienne sont différentes, et les ordres de grandeur peuvent également être très différents. Le simple recours à des fonctions ordinaires ne permet pas d’obtenir pleinement l’effet de couplage. À cet égard,Nous avons construit un réseau neuronal de proximité spatiale SPNN,Cartographiez ces distances dans une mesure de proximité spatiale unifiée.

Par la suite, en entraînant ce réseau neuronal, le calcul d’une fonction spécifique peut être transformé en un processus d’ajustement piloté par les données. C'est notre idée d'utiliser les réseaux neuronaux pour optimiser la proximité spatiale.
Connectez deux réseaux neuronaux pour former osp-GNNWR
Étant donné que la proximité spatiale est un concept abstrait et n’a pas de valeur réelle, par exemple, étant donné le point a et le point b, nous ne pouvons pas dire que la proximité spatiale entre a et b est une valeur définie x. Cela rend impossible la définition de la fonction de perte du SPNN et donc sa formation.

Notre solution est,La sortie de SPNN est directement utilisée comme entrée de distance de GNNWR, et les deux réseaux neuronaux sont connectés pour former un tout unifié, que nous appelons régression pondérée par réseau géographique à mesure de proximité spatiale optimisée (osp-GNNWR).
Selon ce modèle, nous pouvons entraîner directement l'ensemble du réseau via l'erreur de la valeur d'estimation de l'échantillon, et utiliser l'erreur de la valeur ajustée et la valeur ajoutée de la variable dépendante finale y comme fonction de perte pour entraîner directement le réseau. L'ensemble du réseau est formé et le SPNN est également formé en même temps, résolvant ainsi le problème SPNN et complétant la tâche de régression.
Prenant l’exemple des prix de l’immobilier à Wuhan, l’osp-GNNWR fournit une nouvelle explication de l’hétérogénéité spatiale des prix de l’immobilier.
Prenons l’exemple des prix de l’immobilier à Wuhan.Nous avons sélectionné 968 données indépendantes sur les transactions de logements d'occasion à Wuhan et les avons divisées en un ensemble d'entraînement et un ensemble de test dans un rapport de 85:15.À partir de ces données, nous avons sélectionné 10 variables indépendantes dans trois catégories en utilisant la méthode des prix caractéristiques couramment utilisée dans la modélisation des prix des logements, y compris les informations de base sur ces maisons, les installations de soutien environnantes, la commodité des transports, etc. Sur cette base, nous sélectionnons la distance euclidienne et le temps de trajet comme distance d'entrée du SPNN pour construire le modèle osp-GNNWR.

Pour la métrique de proximité spatiale optimisée, comme illustré dans la figure ci-dessous, la couleur de chaque point de la figure représente la différence résiduelle du résultat d'ajustement ; l'orange signifie que l'effet d'ajustement de l'osp-GNNWR est meilleur que celui du modèle GNNWR d'origine ; la ligne représente la différence entre la proximité spatiale optimisée et la distance euclidienne.

Comme on peut le voir sur la figure a, dans la zone périphérique urbaine, la différence entre la distance OSP et la distance euclidienne est importante et, en raison de l’influence de la structure du réseau routier, il existe une certaine différence directionnelle ; en particulier, nous pouvons trouver une différence plus faible dans la direction de la flèche rouge, ce qui est principalement dû au fait que cette direction coïncide avec la deuxième autoroute périphérique de la ville de Wuhan.Cela est dû aux petites différences dans la distance euclidienne et le temps de trajet utilisés pour construire l'OSP.
La figure b montre que dans la zone centrale de la ville, grâce aux infrastructures de transport bien développées, quelle que soit la direction dans laquelle vous allez, la proximité spatiale dans différentes directions est relativement équilibrée.Par conséquent, la différence entre la distance osp et la distance euclidienne montre une distribution de cercles concentriques plus régulière.
À travers ces différences entre l'OSP et la distance euclidienne,Nous avons également pu démontrer l’importance pratique de l’optimisation de la mesure de proximité spatiale.
Sur la base des résultats de la modélisation des prix des logements, nous pouvons discuter plus en détail de l’hétérogénéité spatiale des coefficients de régression, par exemple en étudiant l’impact de la distance universitaire sur les prix des logements.
Comme le montre la figure ci-dessous, les paramètres UA au centre du district de Hongshan, à Wuhan, sont nettement plus élevés que ceux des autres zones.Cela suggère que l’université a un impact positif sur les prix de l’immobilier dans la région.En d’autres termes, plus on est proche d’un établissement d’enseignement, plus les prix des logements sont élevés. De plus, ces universités et institutions de recherche ont également contribué à améliorer le cadre de vie et à créer un marché locatif plus prospère.

Les petits modèles ont également une grande importance
Nous n’avons pas utilisé de grands modèles dans la recherche ci-dessus. Bien que les grands modèles de réseaux neuronaux, les modèles de réseaux profonds, etc. soient très populaires aujourd'hui, les petits modèles ont toujours une importance pratique. En l'absence de puissance de calcul suffisante ou d'échantillons de données riches, la conception d'un modèle petit et esthétique peut être d'une grande aide pour résoudre certains problèmes.
Enfin, il y a quelques références. Si vous êtes intéressé, vous pouvez également les consulter.

Appel à l'action
HyperAI (hyper.ai) est le plus grand moteur de recherche de Chine dans le domaine de la science des données. Il se concentre depuis longtemps sur les derniers résultats de recherche en matière d’IA pour la science et a interprété plus de 100 articles universitaires dans des revues de premier plan.
Les groupes et équipes de recherche qui mènent des recherches et des explorations autour de l'IA pour la science sont invités à nous contacter pour partager leurs derniers résultats de recherche, contribuer à des articles d'interprétation approfondis et participer à la chronique de diffusion en direct Meet AI4S. D’autres moyens de promouvoir l’IA4S nous attendent pour être explorés ensemble !
Ajouter WeChat : HyperaiXingXing (ID WeChat : Hyperai01)