HyperAI

Am Beispiel Des Wohnimmobilienpreises Von 1,7.000 in Shenzhen Verwendet Das GIS-Labor Der Zhejiang-Universität Den Aufmerksamkeitsmechanismus, Um Geografische Kontextmerkmale Zu Ermitteln Und Die Genauigkeit Der Räumlichen Nichtstationären Regression Zu Verbessern.

特色图像

Die geographisch gewichtete Regression (GWR) ist eine statistische Methode, die in der Geodatenanalyse häufig verwendet wird, um die räumliche Nichtstationarität (d. h. räumliche Heterogenität) geografischer Phänomene zu erfassen. Bei der herkömmlichen GWR werden jedem Beobachtungspunkt Gewichte zugewiesen, um seinen Einfluss auf die Regressionsparameter widerzuspiegeln. Diese Gewichte werden üblicherweise auf Grundlage der räumlichen Distanz (z. B. der euklidischen Distanz) berechnet, nach dem Prinzip „je geringer die Distanz, desto größer der Einfluss“. Jedoch,Dieser distanzbasierte Ansatz ignoriert die komplexe Kontextähnlichkeit geografischer Phänomene.Beispielsweise können Ähnlichkeiten bei sozioökonomischen Faktoren oder Umweltmerkmalen wichtige Auswirkungen auf das Regressionsmodell haben. Beispielsweise können in einer städtischen Umgebung zwei weit voneinander entfernte Gebiete aufgrund ähnlicher sozioökonomischer oder ökologischer Faktoren wie Verkehrsanbindung und demografischer Struktur ähnliche Immobilienpreismerkmale aufweisen.

Um dieses Problem zu lösen,Forscher des GIS Key Laboratory der Provinz Zhejiang schlugen ein Deep-Learning-Modell vor, das auf dem Aufmerksamkeitsmechanismus Context-Attention Geographically Weighted Regression (CatGWR) basiert.Das Modell führt einen Aufmerksamkeitsmechanismus ein, um die räumliche Distanz und die kontextuelle Ähnlichkeit zwischen Proben zu kombinieren und so die räumliche Nichtstationarität genauer zu schätzen. Diese Innovation bietet eine neue Perspektive für die Geodatenmodellierung, insbesondere bei der Behandlung komplexer geografischer Phänomene, und kann räumliche Heterogenität und situative Einflüsse besser erfassen.

Die entsprechenden Ergebnisse wurden im International Journal of Geographical Information Science unter dem Titel „Using an attention-based architecture to integrate context similarity into spatial non-stationarity estimation“ veröffentlicht.

Forschungshighlights:

* Das CatGWR-Modell führt einen Aufmerksamkeitsmechanismus zur Berechnung der kontextuellen Ähnlichkeit zwischen Proben ein, wodurch Rauschstörungen in kontextuellen Merkmalen wirksam vermieden und ein genauerer Ähnlichkeitsausdruck erzielt werden können.

* Das CatGWR-Modell weist sowohl bei simulierten als auch bei empirischen Datensätzen erhebliche Genauigkeitsverbesserungen auf und bietet detailliertere Interpretationsanweisungen.

Papieradresse:
https://doi.org/10.1080/13658816.2025.2456556
Adresse der Open Source-Projekte:
https://github.com/yorktownting/CatGWR

Datensatz: Kombination aus Simulationsexperimenten und tatsächlichen Fällen

In diesem Dokument wird die Wirksamkeit des CatGWR-Modells durch Simulationsexperimente und tatsächliche Fallstudien überprüft.Für die Simulationsexperimente wurden zwei 64×64 synthetische Datensätze (S1 und S2) verwendet, wobei Szenarien mit kontextueller Heterogenität bzw. nur räumlicher Heterogenität entworfen wurden.Diese Datensätze konstruieren Regressionsbeziehungen durch simulierte Situationseigenschaften wie räumliche Heterogenität und zufällige Verteilungsmerkmale und bieten so eine kontrollierbare experimentelle Umgebung zur Bewertung der Modellleistung.

Die eigentliche Fallstudie verwendet die Immobilienpreisdaten von Shenzhen, China als Beispiel.Als typisches Beispiel für die rasante Urbanisierung Chinas weisen die Immobilienpreise in Shenzhen eine erhebliche räumliche Heterogenität auf. Die Forschungsdaten umfassen Stichproben der Immobilienpreise von 1.776 Wohngemeinschaften und 7 unabhängige Variablen im Zusammenhang mit den Immobilienpreisen (wie Baujahr, Verwaltungsgebühren, Ökologisierungsrate usw.). Darüber hinaus wurden in der Studie auch 6-dimensionale Taxipassagierdaten als Kontextmerkmale eingeführt. Diese Daten können die städtische Dynamik und die Muster menschlicher Aktivitäten widerspiegeln und dem Modell umfangreiche räumliche und kontextuelle Informationen liefern.

Modellarchitektur: Geografisch gewichtete Regression, gesteuert durch kontextuelle Aufmerksamkeit

Das CatGWR-Modell verwendet einen additiven Aufmerksamkeitsmechanismus, um die Ähnlichkeit geografischer Kontexte zu berechnen und kombiniert diese mit räumlichen Distanzgewichten.Das Modell ist in drei Module unterteilt: Präprozessormodul, Verstärkermodul und Regressionsmodul.Wie in der folgenden Abbildung dargestellt:

CatGWR Strukturdesign

(a) Vorverarbeitungsmodul:Verantwortlich für das Extrahieren abhängiger Variablen, unabhängiger Variablen und kontextueller Merkmale aus den Eingabedaten und das Berechnen der räumlichen Gewichtsmatrix und der räumlichen Konnektivitätsmatrix zwischen jeder Probe und ihrer Nachbarschaft.

(b) Verstärkungsmodul:Erweitern Sie das rezeptive Feld des Modells und verbessern Sie die Nutzung von Nachbarschaftsinformationen durch das Modell.

(c) Regressionsmodul:Die kontextuelle Ähnlichkeit zwischen den Proben wird durch den Aufmerksamkeitsmechanismus berechnet und mit der räumlichen Gewichtsmatrix kombiniert, um die kontextualisierten räumlichen Gewichte zu erhalten. Das mehrschichtige Perzeptron (MLP) wird verwendet, um die kontextualisierten räumlichen Gewichte in Regressionskoeffizienten umzuwandeln und so die Schätzung der räumlichen Nichtstationarität zu realisieren.

Experimentelle Schlussfolgerung: Aufdeckung der räumlichen Nichtstationarität der Determinanten der Immobilienpreise in Shenzhen

In diesem Artikel wird die Wirksamkeit des CatGWR-Modells durch Simulationsexperimente und empirische Untersuchungen zu den Immobilienpreisen in Shenzhen überprüft.Im Simulationsexperiment haben wir zunächst Kontextvariablen von vier geografischen Szenarien simuliert und generiert und die generierten Kontextvariablen verwendet, um zwei Sätze simulierter Datensätze zu erstellen: S1 (die Kontextvariablen waren als Teil der Koeffizienten an der Datensatzgenerierung beteiligt) und S2 (die Kontextvariablen waren für die Regressionsbeziehung irrelevant und wurden zum Rauschen in CatGWR). Die experimentellen Ergebnisse zeigen, dass:

* Im Szenario Szenario (S1),CatGWR kann die Ähnlichkeit von Szenarien genauer auflösen und sie effektiv mit der räumlichen Nähe koppeln, wodurch es bestehende Modelle wie GWR, MGWR, CGWR und GNNWR deutlich übertrifft.

* Im nicht-kontextualisierten Szenario (S2)Selbst wenn für den Datensatz irrelevante „Kontextvariablen“ als Rauschen eingeführt werden, ist die Leistung von CatGWR aufgrund der Robustheit des von ihm verwendeten Aufmerksamkeitsmechanismus dem herkömmlichen GWR-Modell nicht unterlegen.

Vergleichende Testergebnisse von CatGWR anhand simulierter Datensätze

Im Datensatz zu den Immobilienpreisen in Shenzhen stellt das CatGWR-Modell seine Überlegenheit weiter unter Beweis.Im Vergleich zu den vorhandenen Modellen stieg der R²-Wert von CatGWR im Trainingssatz von 0,853 auf 0,920 und der R²-Wert im Vorhersagesatz von 0,717 auf 0,764, und RMS E und MAE sanken um 28% bzw. 26%.

Auch,Das CatGWR-Modell zeigt auch die räumliche Nichtstationarität der Determinanten der Immobilienpreise in Shenzhen.In der Nähe der Shenzhen Bay beispielsweise ist der Einfluss der Anzahl unterstützender Parkplätze auf die Immobilienpreise aufgrund des Einflusses der Pendler zwischen Shenzhen und Hongkong, die durch den Shenzhen-Hongkong-Westkorridor bedingt sind, größer als in anderen Gebieten. Gleichzeitig spiegelt das Merkmal „ähnliche Entfernung, aber unterschiedliche Gewichtung“ der situativen räumlichen Gewichtungen zwischen den Stichproben auch die Merkmale der Stadtbebauung und Zonierung in Shenzhen wider. Dies zeigt, dass CatGWR die Auswirkungen räumlicher Heterogenität und Szenarioähnlichkeit auf die Immobilienpreise effektiv erfassen kann.

Unterschiede in den szenariobasierten Gewichtungen und den darin reflektierten städtebaulichen und zonierenden Merkmalen der Stadt Shenzhen

* Stadt-Land-Unterschiede durch die Einrichtung von Sonderwirtschaftszonen (Gewichte AE > AD, AC > AB bei ähnlichen räumlichen Entfernungen)

* Unterschiede in der Landnutzungsart (Satellitenstadt-Landschaftsraum) (FH > FL, FG > FL)

Das CatGWR-Modell kombiniert durch die Einführung des Aufmerksamkeitsmechanismus erfolgreich Szenenähnlichkeit mit räumlicher Nähe und verbessert so die Genauigkeit und Robustheit der räumlichen Nichtstationaritätsmodellierung erheblich.Dieses Modell zeigt nicht nur bei simulierten Daten eine gute Leistung, sondern weist auch in praktischen Anwendungen starke Anpassungsfähigkeiten auf und liefert neue Ideen und Methoden für die geografische Prozessmodellierung.

Mit Immobilienpreisprognosen geografische Prozesse wissenschaftlich erklären

April 2024Das Forschungsteam des GIS-Labors der Provinz Zhejiang veröffentlichte außerdem einen Artikel zum gleichen Forschungsgebiet im International Journal of Geographical Information Science.Die durch das neuronale Netzwerk optimierte räumliche Nähemetrik wird außerdem mit der Methode der geographisch neuronalen gewichteten Regression (GNNWR) kombiniert, um das osp-GNNWR-Modell zu erstellen, das das Training des neuronalen Netzwerks durch Lösen der räumlichen nichtstationären Regressionsbeziehung zwischen abhängigen Variablen und unabhängigen Variablen realisiert.
Link zum Artikel:
https://www.tandfonline.com/doi/full/10.1080/13658816.2024.2343771

Klicken Sie hier, um den vollständigen Bericht anzuzeigen: Das GIS-Labor der Zhejiang-Universität schlug das osp-GNNWR-Modell vor: Genaue Beschreibung komplexer räumlicher Prozesse und geografischer Phänomene

Zufällig wurden in dieser Studie Immobiliendaten aus Wuhan als Beispiel für die Recherche und Überprüfung verwendet. Die experimentellen Ergebnisse zeigten, dass das osp-GNNWR-Modell potenzielle Vorteile bei der Darstellung der räumlichen Heterogenität realer geografischer Prozesse bietet.

Ding Jiale, Doktorand für Fernerkundung und geografische Informationssysteme an der Zhejiang-Universität, ist der Autor der Studie.In einer Online-Sitzung zum wissenschaftlichen Austausch erklärte er einmal: „Als Forscher der Geographie halte ich es für langweilig, wenn die von uns entwickelten Modelle lediglich die Immobilienpreise vorhersagen können. Unser Ziel ist es, die von diesen Modellen ausgegebenen und je nach räumlicher Lage unterschiedlichen Regressionskoeffizienten zu nutzen, um geografische Prozesse oder Muster wissenschaftlich fundiert zu erklären. Diese Forschung ist praxisorientierter.“

Zwar kann die Forschung in den Geowissenschaften zwischen Hochhäusern in der Stadt verborgen sein oder weit entfernt auf den Gipfeln von Bergen, Flüssen, Seen und Meeren stattfinden, doch letzten Endes wird sie auf dieses Land fallen und den Menschen helfen, geografische Prozesse besser zu verstehen und die Bedeutung hinter geografischen Phänomenen zu erforschen. In den letzten Jahren hat es mit der kontinuierlichen Weiterentwicklung der Beobachtungstechnologie ein explosionsartiges Wachstum bei raumzeitlichen Daten im Bereich der Geowissenschaften gegeben, was die Implementierung neuer Technologien wie KI im Bereich der Geowissenschaften weiter vorangetrieben hat.

Das GIS Key Laboratory der Provinz Zhejiang ist ein Pionier in der interdisziplinären Forschung zwischen KI und Geowissenschaften.Durch die Kombination des Konzepts der traditionellen geografisch gewichteten Regression mit der Technologie neuronaler Netzwerke werden eine Reihe innovativer Modelle vorgeschlagen, darunter die geografisch gewichtete Regression mit neuronalen Netzwerken (GNNWR) und die geografisch raumzeitlich gewichtete Regression mit neuronalen Netzwerken (GTNNWR).

Seit der Veröffentlichung des ersten Artikels haben eine Reihe von Methoden wie GNNWR und GTNNWR viel Aufmerksamkeit erregt und in vielen Bereichen wie Ozeanographie, Geographie, Atmosphärenwissenschaften und Geologie breite Anwendung gefunden. Das Team hat mehr als 30 entsprechende Artikel veröffentlicht. Gleichzeitig dienen die relevanten Ergebnisse auch anderen Teams in der Branche als Inspiration und Erkenntnis. Viele externe Teams verwenden ähnliche Modellierungsideen oder technische Architekturen, um Forschung zu betreiben, und genau darin liegt der Reiz der Open-Source-Forschung.

GNNWR Open Source-Adresse:

https://github.com/zjuwss/gnnwr