武漢の住宅価格を正確に予測!浙江大学の GIS 研究室は、複雑な空間プロセスと地理現象を正確に記述する osp-GNNWR モデルを提案しました。

特色图像

住宅は人間の幸福と社会発展の重要な部分であり、住宅価格の変動は社会から広く注目されています。中国は地理的に非常に広い国であり、同じ都市の同じ管轄区であっても、地域環境、学区、支援企業などの要因により、地域ごとに住宅価格が異なるため、住宅価格に関する研究が重点的に行われています。ホットスポットの 1 つは、その空間的な差別化と影響メカニズム、いわゆる「空間的不均一性」です。

近年、住宅価格の空間的差異はますます顕著になってきており、複雑な地理的環境における住宅価格の「空間的不均一性」を把握するには、単一の距離測定方法では不十分です。特に武漢のような大都市では、自然地形(河川、湖など)や都市インフラ(橋、トンネル、多層道路網など)やその他の要因が住宅価格に複雑な影響を及ぼします。従来の地理的重み付け回帰 (GWR) モデルは、空間的近接性を測定する際に課題に直面しています。

これに関連して、浙江大学 GIS 研究所の研究者らは、「地理的加重回帰アプローチにおける空間的近接性の尺度を最適化するニューラル ネットワーク モデル: 武漢の住宅価格に関するケーススタディ」というタイトルの論文を発表しました。

この研究では、ニューラル ネットワーク手法を革新的に導入し、観測点間の複数の空間近接尺度 (ユークリッド距離、移動時間など) の非線形結合を実行して、最適化された空間近接尺度 (OSP) を取得し、それによってモデルの住宅予測を向上させます。価格の予測精度。

抽象的な「空間的近接性」では損失関数が構築できず、ニューラルネットワークの訓練が難しいという問題を解決するために、この研究では、OSP と地理的ニューラル ネットワーク加重回帰 (GNNWR) 手法をさらに組み合わせています。osp-GNNWR モデルは、従属変数と独立変数の間の空間非定常回帰関係を解くことによってニューラル ネットワーク トレーニングを実装するために構築されました。

研究のハイライト:

  • 最適化された空間近接指標を導入し、ニューラル ネットワーク アーキテクチャに統合することにより、住宅価格などの地理的プロセスの空間分布の研究における地理的重み付け回帰の適用可能性が効果的に向上します。
  • シミュレートされたデータセットと武漢の住宅価格の経験的ケースの研究を通じて、論文で提案されたモデルは世界的に優れたパフォーマンスを持ち、複雑な空間プロセスと地理的現象をより正確に記述できることが証明されました。
  • これにより、ローカル条件に従って空間近接メトリクスをカスタマイズする方法を研究し、それによってさまざまな地理空間回帰モデルのパフォーマンスを向上させる新しい方法が開かれます。

用紙のアドレス:
https://www.tandfonline.com/doi/full/10.1080/13658816.2024.2343771

オープンソース プロジェクト「awesome-ai4s」は、100 を超える AI4S 論文の解釈をまとめており、大規模なデータ セットとツールも提供しています。

https://github.com/hyperai/awesome-ai4s

データセット: 典型的な研究地域としての武漢

シミュレートされたデータセット

osp-GNNWR モデルのフィッティング精度を評価するために、研究者らは 64×64 の空間不均一性シミュレーション データセットを生成しました。シミュレートされたデータセットの空間的不均一性は、直線距離に反映されるだけでなく、非ユークリッド距離によって定義される空間分布特性も示し、OSP の有効性を実証できます。

実際のデータセット

湖北省の省都、武漢は中国中部、漢江と長江の交わる場所に位置します。武漢は湿気の多い亜熱帯気候で、降水量が豊富で、数多くの川、湖、池があるため、空間的な近接性を評価することが困難です。中国中部で最大かつ最も人口密度の高い都市である武漢には、不動産市場も盛んであり、武漢特有の不動産動向の包括的なモデルを構築するのに十分なデータが提供されています。

研究領域とデータセット

この目的を達成するために、研究者らは、968 の異なる不動産サンプルのデータセットを編集しました。これらのデータは、2019 年の武漢の中古住宅取引記録から取得したものです。データソースは Anjuke (https://wuhan.anjuke.com)。これらのレコードはすべてクリーンアップされ、特殊な種類の不動産 (ヴィラなど) が除外され、データの品質が保証されました。

モデル アーキテクチャ: 最適化された空間近接インジケーターを導入し、ニューラル ネットワークに統合します。

osp-GNNWR モデルの構築は 2 つのステップに分かれています。

ステップ 1: 最適化された空間近接測定 (OSP) を取得する

複雑な地理解析でより正確な空間近接測定を取得するために、この研究では、ユークリッド距離、マンハッタン距離、移動時間などの複数の距離測定方法を統合して、空間近接 (OSP) を最適化します。このようにして、最適化された空間近接測定により、複雑な空間関係におけるさまざまな影響要因をより適切に反映できるため、空間回帰モデルのフィッティングと説明力が向上します。

第 2 ステップ: OSP と GNNWR をさらに組み合わせ、研究者らは osp-GNNWR モデルを提案しました。以下に示すように:

osp-GNNWR モデル設計

具体的には、osp-GNNWR モデルのトレーニングと検証の手順は次のとおりです。

osp-GNNWR モデルのトレーニング手順

ステップ 1:回帰モデルの構築に使用される従属変数と独立変数を抽出します。

ステップ 2:データセットを適切な割合でトレーニングセット、検証セット、テストセットにランダムに分割します。

ステップ 3:osp-GNNWR モデルの空間情報としてサンプル距離を計算します。

ステップ 4:入力変数と空間情報を使用して、ネットワーク構造とハイパーパラメーターを含む OSP-GNNWR モデルを確立します。

ステップ5:トレーニング セットからミニバッチ データを取得し、トレーニングに勾配降下アルゴリズムを使用し、損失関数として平均二乗誤差 (MSE) を使用するなど、適合度を評価します。

ステップ6:現在のサイクル (エポック) が完了したかどうかを評価し、完了していない場合はステップ 5 に戻ります。

ステップ 7:検証セットの損失関数を評価して、過学習が存在するかどうかを判断します。損失が以前の最適な結果よりも改善されている場合は、新しい優れたモデルを保持し、そうでない場合は、過学習許容値の数を増やします。

ステップ8:過学習許容値またはエポックの最大数 (最大エポック) に達しているかどうかを評価します。限界に達している場合は、トレーニングが停止し、テスト セットを使用して最新の優れたモデルが評価されます。それ以外の場合は、ステップ 5 から反復が継続されます。

上記の手順を通じて、研究者は、osp-GNNWR モデルを効果的にトレーニングおよび検証して、複雑な空間関係における異質性を捉えて説明し、モデルの精度と信頼性を向上させることができます。

研究結果: osp-GNNWR モデルのグローバル パフォーマンスが向上

まず、シミュレーションされたデータセットに基づく分析結果を見てみましょう。研究者らは、ユークリッド距離と Z オーダー距離に基づいた一連のシミュレーション データ セットについて、OLS、GWR、GNNWR、osp-GNNWR などのモデルを使用して比較しました。その結果を次の表に示します。

シミュレートされたデータセットにおけるosp-GNNWRと他の比較モデルの実験結果
  • R²: 1 つの変数 (従属変数) の変化が、別の変数 (独立変数) の変化によってどの程度説明できるかを示す尺度。この値は通常、モデルの適合度を評価するために線形回帰分析で使用されます。 0% は、モデルが平均付近の応答変数の変動を説明できないことを意味します。つまり、モデルとデータの間にはほとんど関係がありません。100% は、モデルが平均付近の応答変数のすべての変動を説明できることを意味します。つまり、モデルはデータに完全に適合します。
  • RMSE (二乗平均平方根差): 観測値と真の値との偏差を測定するために使用され、値が小さいほどモデルの予測精度が高くなります。
  • MSE (平均絶対誤差): モデルの予測値と実際の値の間の平均絶対偏差を測定するために使用され、値が小さいほど、モデルの予測精度が高くなります。

トレーニング データ セットでもテスト データ セットでも、osp-GNNWR モデルは R² が高く、RMSE 値が低く、MSE 値が低いため、より優れたパフォーマンスを示しています。これらのシミュレーション実験結果は、osp-GNNWR モデルで使用される SPNN ネットワークが、入力距離を処理する際に優れた汎化機能と高精度のフィッティング効果を備えていることを証明しています。したがって、ユークリッド距離のみに依存する従来の方法と比較して、osp-GNNWR モデルには、現実世界の地理プロセスにおける空間的不均一性の特徴付けにおいて潜在的な利点があります。

2 つ目は、実際の武漢の住宅価格データに基づいた OSP-GNNWR モデルのパフォーマンスです。次の表は、OLS、GWR、GNNWR、および osp-GNNWR モデルのパフォーマンスの比較結果を示しています。

武漢の住宅価格データセットに関するosp-GNNWRと他の比較モデルの実験結果

同様に、osp-GNNWR モデルは、トレーニング データ セットとテスト データ セットの両方で、R² が高く、RMSE 値が低く、MSE 値が低く、より優れたパフォーマンスを示しています。

GNNWR(TD) と比較して、osp-GNNWR モデルはテスト データ セットの R² を 0.737 から 0.793 に改善し、RMSE を 0.168 から 0.149 に減少させ、MAE を 0.125 から 0.109 に減少させていることは注目に値します。これらの結果は次のことを示していますOSP を統合すると、osp-GNNWR モデルのフィッティングと予測のパフォーマンスが向上します。調査したモデルの中で最も効率的な方法となります。

  • GNNWR(TD): 近接尺度として移動時間を使用する GNNWR モデル。

具体的には、江夏区の唐勲湖西岸、蔡甸区の后公湖沿岸、漢江と長江の合流点など、複雑な自然景観とインフラが存在する地域では、紅山区と新州区が発展しています。高速道路網と物理的空間的近接性osp-GNNWR モデルの残差は他のモデルよりも大幅に小さく、予測精度が高いことがわかります。

全体として、この研究の結果は、空間的異質性を表現するosp-GNNWRモデルの能力を強化し、それによって不動産市場内の複雑な空間関係のモデリングを促進するというOSPの有効性を強調しています。

ディープラーニングは複雑な住宅価格予測問題に役立ちます

住宅価格の空間的差別化の原因と影響メカニズムを解明することは、不動産市場の安定的な発展を維持し、都市計画や住宅の満足度を向上させる上で非常に重要です。ただし、住宅価格の予測は非常に複雑な問題であり、地理的位置、交通の利便性、学区、住宅年齢、住宅タイプなどの多くの要素が関係します。従来の手法は通常、統計と機械学習に基づいていますが、データのサイズと複雑さが増大するにつれて、これらの手法に対処することが困難になります。ディープラーニングには強力な特徴学習機能と分類機能があり、このような問題をより適切に処理できます。

住宅価格予測の精度を向上させるために、業界の研究は主に次の方向に焦点を当てています。

1 つは混合モデルのアプローチです。つまり、ディープラーニングと従来の機械学習手法を組み合わせて、それぞれの利点を最大限に発揮します。たとえば、ディープ ラーニングをサポート ベクター マシン (SVM) やランダム フォレストなどの従来の機械学習手法と組み合わせて、住宅価格予測用のハイブリッド モデルを構築できます。

2 つ目は時系列データを考慮することです。すなわち、住宅価格の予測においては、住宅の静的属性を考慮することに加えて、過去の住宅価格や経済指標などの時系列データも考慮することができ、リカレントニューラルネットワーク(RNN)などの手法が利用されます。 ) 分析と予測に使用できます。

例えば、一部の研究者は、Google の特許に関するアテンション メカニズムに基づいた畳み込み時系列住宅価格予測方法を導入しました。研究者らはまず住宅価格データセットを前処理し、住宅価格に関連する多次元要因で構成される時系列を取得しました。

住宅価格に影響を与える多次元の相関要因と、住宅価格の動向への変動と影響を考慮して、アテンションメカニズムに基づく畳み込み逐次ニューラルネットワークを使用して住宅価格を予測します。多次元相関係数を予測するために使用され、さらなる特徴抽出と次元削減の後、特徴ベクトルが処理されて多次元特徴ベクトルが取得され、その特徴ベクトルが長期記憶モデルに入力され、長期記憶が学習されます。期間全体の傾向と、フィーチャ間の短期的な局所依存情報。

この方法は、住宅価格時系列予測の長期的な全体傾向と短期的な局所情報を組み合わせて、住宅価格予測の分散を低減し、多次元時系列データ住宅価格予測方法の一般化能力を向上させます。

3つ目は地理情報システム(GIS)の活用です。ディープラーニングと地理情報システム (GIS) を組み合わせて、地理的位置やその他の要因が住宅価格に与える影響を分析し、モデルの予測精度を向上させます。前述の osp-GNNWR モデルはその代表的なモデルの 1 つです。

AI のサポートにより、住宅価格予測モデルの信頼性と正確性が高まります。これに基づいて、不動産会社は投資リスクを軽減し、政府は住宅情報を包括的かつ正確に管理し、それを目標に管理し、良好な不動産環境を共同で創造し、人々が真に安心して生活し、働くことができるようにすることができます。満足。

参考文献:
1.https://www.tandfonline.com/doi/full/10.1080/13658816.2024.2343771
2.https://mp.weixin.qq.com/s/P4nk5sl2v60Q5DeVrOfWLw
3.https://cloud.baidu.com/article/1892933
4.https://patents.google.com/pate