HyperAI超神経

浙江大学GIS研究所は、深センの1.7K住宅価格を例にとり、注目メカニズムを使用して地理的コンテキストの特徴をマイニングし、空間非定常回帰の精度を向上させます。

特色图像

地理加重回帰分析 (GWR) は、地理現象の空間的非定常性 (つまり、空間的異質性) を捉えるために地理空間分析で広く使用されている統計手法です。従来の GWR では、各観測点に重みを割り当てて、回帰パラメータへの影響を反映します。これらの重みは通常、「距離が近いほど影響が大きくなる」という原則に従って、空間距離 (ユークリッド距離など) に基づいて計算されます。しかし、この距離ベースのアプローチでは、地理的現象の複雑な文脈上の類似性は無視されます。たとえば、社会経済的要因や環境特性の類似性は、回帰モデルに重要な影響を及ぼす可能性があります。たとえば、都市環境では、交通の利便性や人口構成などの社会経済的要因や環境的要因が似ているため、2 つの離れた地域が同様の住宅価格特性を示すことがあります。

この問題を解決するには、浙江省GIS重点研究室の研究者らは、注目メカニズムに基づくディープラーニングモデル、コンテキスト注目地理加重回帰(CatGWR)を提案した。このモデルは、サンプル間の空間距離とコンテキストの類似性を組み合わせて空間の非定常性をより正確に推定するための注意メカニズムを導入します。この革新は、特に複雑な地理的現象を扱う場合に、地理空間モデリングに新たな視点を提供し、空間の異質性と状況の影響をより適切に捉えることができます。

関連する結果は、「注意ベースのアーキテクチャを使用してコンテキストの類似性を空間非定常性推定に組み込む」というタイトルで、International Journal of Geographical Information Science に掲載されました。

研究のハイライト:

* CatGWR モデルは、サンプル間のコンテキスト類似性を計算するためのアテンション メカニズムを導入します。これにより、コンテキスト機能におけるノイズ干渉を効果的に回避し、より正確な類似性表現を取得できます。

* CatGWR モデルは、シミュレートされたデータセットと経験的データセットの両方で精度が大幅に向上し、より詳細な解釈の方向性を提供します。

用紙のアドレス:
https://doi.org/10.1080/13658816.2025.2456556
プロジェクトのオープンソースのアドレス:
https://github.com/yorktownting/CatGWR

データセット: シミュレーション実験と実際のケースの組み合わせ

本論文では、シミュレーション実験と実際のケーススタディを通じて、CatGWR モデルの有効性を検証します。シミュレーション実験では、2 つの 64×64 合成データセット (S1 と S2) を使用し、それぞれコンテキストの異質性と空間の異質性のみを持つシナリオを設計しました。これらのデータセットは、空間的異質性やランダム分布特性などのシミュレートされた状況特性を通じて回帰関係を構築し、モデルのパフォーマンス評価のための制御可能な実験環境を提供します。

実際のケーススタディでは、中国・深センの住宅価格データを例に挙げます。中国の急速な都市化の典型的な例として、深センの住宅価格は顕著な空間的異質性を示しています。調査データには、1,776の住宅コミュニティの住宅価格サンプルと、住宅価格に関連する7つの独立変数(建築年、管理費、緑化率など)が含まれています。さらに、この研究では、コンテキスト特性として 6 次元のタクシー乗客データも導入しました。これらのデータは都市のダイナミクスと人間の活動パターンを反映し、モデルに豊富な空間情報とコンテキスト情報を提供します。

モデルアーキテクチャ: コンテキストアテンションによる地理的重み付け回帰

CatGWR モデルは、付加的な注意メカニズムを使用して地理的コンテキストの類似性を計算し、それを空間距離の重みと組み合わせます。モデルは、プリプロセッサ モジュール、アンプ モジュール、回帰モジュールの 3 つのモジュールに分かれています。以下に示すように:

CatGWR 構造設計

(a) 前処理モジュール:入力データから従属変数、独立変数、コンテキスト機能を抽出し、各サンプルとその近傍間の空間重みマトリックスと空間接続マトリックスを計算します。

(b)増幅モジュール:モデルの受容フィールドを拡大し、モデルによる近隣情報の利用を強化します。

(c) 回帰モジュール:サンプル間のコンテキスト類似性はアテンションメカニズムを通じて計算され、空間重みマトリックスと組み合わせてコンテキスト化された空間重みを取得します。コンテキスト化された空間重みは、多層パーセプトロン (MLP) を使用して回帰係数に変換され、空間非定常性の推定を実現します。

実験的結論:深センの住宅価格の決定要因の空間的非定常性を明らかにする

本論文では、シミュレーション実験と深センの住宅価格に関する実証研究を通じて、CatGWRモデルの有効性を検証します。シミュレーション実験では、まず 4 つの地理的シナリオのコンテキスト変数をシミュレートして生成し、生成されたコンテキスト変数を使用して、さらに 2 つのシミュレートされたデータ セット セットを構築しました。S1 (コンテキスト変数は係数の一部としてデータ セット生成に参加します) と S2 (コンテキスト変数は回帰関係とは無関係で、CatGWR へのノイズ入力になります)。実験結果は次のことを示しています。

* シナリオ(S1)では、CatGWR はシナリオの類似性をより正確に解決し、それを空間的近接性と効果的に組み合わせることができるため、GWR、MGWR、CGWR、GNNWR などの既存のモデルを大幅に上回る性能を発揮します。

* 文脈化されていないシナリオ(S2)では、データセットとは無関係な「コンテキスト変数」がノイズとして導入されたとしても、CatGWR が使用するアテンション メカニズムの堅牢性により、そのパフォーマンスは従来の GWR モデルに劣りません。

シミュレーションデータセットにおけるCatGWRの比較テスト結果

深センの住宅価格データセットでは、CatGWR モデルがさらにその優位性を実証しています。既存のモデルと比較すると、トレーニング セットでの CatGWR の R² 値は 0.853 から 0.920 に増加し、予測セットでの R² 値は 0.717 から 0.764 に増加し、RMS E と MAE はそれぞれ 28% と 26% 減少しました。

また、CatGWR モデルは、深センの住宅価格の決定要因の空間的非定常性も明らかにしています。例えば、深圳湾付近では、深圳・香港西部回廊によってもたらされた深圳と香港間の通勤者の影響により、補助駐車場の数が住宅価格に与える影響は他の地域よりも大きい。同時に、サンプル間の状況的空間重みの「距離は似ているが重みが異なる」という特徴も、深センの都市建設と区画分けの特徴を反映している。これは、CatGWR が空間的異質性とシナリオの類似性が住宅価格に与える影響を効果的に捉えられることを示しています。

シナリオベースの重みの違いと、そこに反映されている深セン市の都市建設とゾーニングの特徴

* 特別経済区の建設によって生じた都市と農村の差異(同様の物理的距離では、AE > AD、AC > ABの重み)

* 土地利用形態の違い(衛星都市・景勝地)(FH > FL、FG > FL)

CatGWR モデルは、アテンション メカニズムを導入することでシーンの類似性と空間の近接性をうまく組み合わせ、空間非定常モデリングの精度と堅牢性を大幅に向上させます。このモデルは、データのシミュレーションで優れたパフォーマンスを発揮するだけでなく、実際のアプリケーションで強力なフィッティング機能を発揮し、地理プロセス モデリングの新しいアイデアと方法を提供します。

住宅価格予測を用いて地理的プロセスを科学的に説明する

2024 年 4 月浙江省GIS研究所の研究チームも、同じ研究分野に関する論文を国際地理情報科学誌に発表した。ニューラル ネットワークによって最適化された空間近接性メトリックは、地理ニューラル ネットワーク加重回帰 (GNNWR) 法とさらに組み合わせて osp-GNNWR モデルを構築します。このモデルは、従属変数と独立変数間の空間非定常回帰関係を解くことによってニューラル ネットワークのトレーニングを実現します。
論文リンク:
https://www.tandfonline.com/doi/full/10.1080/13658816.2024.2343771

完全なレポートを見るにはクリックしてください: 浙江大学GIS研究所は、osp-GNNWRモデルを提案しました: 複雑な空間プロセスと地理的現象を正確に記述します

偶然にも、この研究では武漢の不動産データを研究と検証の例として使用しました。実験結果から、osp-GNNWR モデルは現実世界の地理的プロセスの空間的異質性を描写する上で潜在的な利点があることが示されました。

この研究の著者は、浙江大学でリモートセンシングと地理情報システムを研究する博士課程の学生、丁嘉楽氏である。彼はかつてオンラインの学術共有セッションで次のように紹介した。「地理科学の探究者として、私たちが考案したモデルが住宅価格を単純に予測することしかできないのであれば、そのような結果はつまらないと私は思います。私たちが追求しているのは、空間的な位置によって変化するこれらのモデルによって出力される一連の回帰係数を使用して、地理的なプロセスやパターンを科学的に合理的に説明することです。そのような研究の方がより実用的です。」

確かに、地球科学の研究は、都市の高層ビル群の中に隠れていたり、はるか遠くの山や川、湖、海の頂上で航海していたりするかもしれませんが、最終的にはすべてこの土地に降り注ぎ、人々が地理的プロセスをよりよく理解し、地理的現象の背後にある意味を探求するのに役立ちます。近年、観測技術の継続的な進歩により、地球科学分野における時空間データは爆発的な増加を示しており、地球科学分野におけるAIなどの新興技術の実装がさらに促進されています。

浙江省GIS重点実験室は、AIと地球科学の学際研究の先駆者です。従来の地理加重回帰の概念とニューラル ネットワーク技術を組み合わせることで、地理ニューラル ネットワーク加重回帰 (GNNWR) や地理時空間ニューラル ネットワーク加重回帰 (GTNNWR) などの一連の革新的なモデルが提案されています。

最初の論文が発表されて以来、GNNWRやGTNNWRなどの一連の手法は大きな注目を集め、海洋学、地理学、大気科学、地質学など多くの分野で広く利用されてきました。研究チームは30本以上の関連論文を発表しています。同時に、関連する結果は業界の他のチームにもインスピレーションと啓発をもたらします。多くの外部チームが同様のモデリングのアイデアや技術アーキテクチャを使用して研究を行っていますが、これはまさにオープンソース研究の魅力です。

GNNWR オープンソース アドレス:

https://github.com/zjuwss/gnnwr