浙江大学のDu Zhenhong氏のチームは、5つの高度なモデルよりも優れたGNNWLRモデルを提案し、石化予測の精度を向上させました。

カタールワールドカップは2010年にワールドカップ開催権を獲得して以来、累計投資額約2,290億ドルをかけて2022年に無事開催される予定です。それに比べて、過去 7 回のワールドカップの総費用はわずか約 400 億ドルでした。このスポーツ イベントは、カタールという国の奥深い伝統に端を発する贅沢なスタイルを示しています。 「家に鉱山があるなら、パニックにならないでください。」ということわざがあるように、カタールはその豊富な鉱物資源に資金を費やし、視聴覚の饗宴を作り出しています。
鉱物資源は、個人にとっては無尽蔵で莫大な富を意味し、魅力的ですが、社会にとっては、国家経済、国民生活、国家安全保障に関わる経済社会発展の重要な柱です。しかし、鉱物資源は地下数百メートルに隠されており、貴重な鉱物資源を発見するには多大な労力が必要です。
鉱物探査分野の継続的な発展に伴い、業界は「鉱物化システム-探査システム-予測および評価システム」に導かれる研究ルートを徐々に形成してきました。人工知能は鉱物資源の予測および評価 (MPM) システムにおいてますます重要な役割を果たしていますが、その応用には依然として一定の制限があり、そのため地質学者が最終結果を信頼することが困難になることがよくあります。
鉱化予測モデルと鉱化プロセス中に地質学的要因によって引き起こされる空間的非定常性の解釈可能性を向上させるために、浙江大学の研究チームは、新しい地理空間人工知能手法である地理的ニューラル ネットワーク加重ロジスティック回帰 (GNNWLR) を提案しました。
このモデルは、空間パターンとニューラル ネットワークを統合し、Shapley の加法的説明理論と組み合わせることで、予測の精度を大幅に向上させるだけでなく、複雑な空間シーンにおける鉱物予測の解釈可能性も向上させます。

研究のハイライト
* 地理的ニューラル ネットワーク加重ロジスティック回帰モデル GNNWLR を提案
* GNNWLR は鉱物資源の予測と評価において他の先進的なモデルを上回ります。
* GNNWLR は空間的不均一性と非線形効果を克服します
* GNNWLR は、石灰化メカニズムに対する人工知能の解釈可能性を向上させます

用紙のアドレス:
https://doi.org/10.1016/j.jag.2024.103746
公式アカウントをフォローし、バックグラウンドで「マイニング予測」に返信すると全文PDFが入手できます
世界的な MPM 試験場を目指して競争: カナダ、ノバスコシア州メグマ地域
この研究は、主に草原と森林で覆われている、カナダのノバスコシア州西部にある約7,800平方キロメートルの地域であるメグマ層群に焦点を当てた。メグマ地層は 2 つの地層で構成されており、下の層はゴールデンビル層群で、主に変成砂岩から構成されています。上層はハリファックス層群で、頁岩の複雑な岩石から構成されています。
アカディア期の造山活動とデボン紀の花崗岩の定置により、この地域は北東から南西に向かう一連の褶曲構造を形成し、さまざまな鉱物資源予測・評価システムの実験場となっている。

調査地域には 20 のタービダイト金鉱床があります。したがって、この研究では、背斜構造因子、ゴールデンビル層とハリファックス層の間の接触因子、銅 (Cu)、鉛 (Pb)、ヒ素 (As)、亜鉛 (Zn) などの化学元素を含む 6 つの特徴的な層を使用しました。
この研究では、そのうち、ゴールデンビル層とハリファックス層の間の背斜と接触面について複数リングのバッファ解析を実施し、0.5km間隔で対応する重みを割り当て、合計16個のバッファリングを形成しました。同時に、この研究では、化学元素を含む 671 個の湖の堆積物サンプルに対して逆距離加重補間 (IDW) も実施しました。最後に、この調査では調査エリア全体をグリッド化し、すべてのフィーチャ レイヤーを 1km x 1km のラスター データに統合しました。
20 個の陽性サンプルは調査範囲全体に比べてまだ少なすぎるため、陽性サンプルと陰性サンプルの比率が不均衡になる傾向があります。したがって、この研究では緩衝地帯も分析し、20 の陽性サンプル ポイントの周囲の半径 2 km を分割し、ラスター分析を実行しました。
最終的に、この研究では 245 個の陽性サンプルが得られ、鉱物堆積物の存在を示し、その他は存在しないことを示しました。同時に、この研究では、陰性サンプル セットから陽性サンプルと同量のデータをランダムに選択し、それを陽性サンプルと結合して、トレーニング セットと検証セットを作成しました。
GNNWR モデル: ニューラル ネットワークを効率的にアンサンブルする
地理ニューラルネットワーク加重回帰(GNNWR)のモデル構造は平均二乗誤差を使用するため、鉱物資源の予測評価に直接適用すると収束の問題が発生する可能性があります。研究により、クロスエントロピーには平均二乗誤差よりも実際的な利点があることが証明されています。したがって、この研究では、ロジスティック回帰のために特別に設計された損失関数、バイナリ クロス エントロピー (BCE) を使用しました。
このコンテキストでは、GNNWLR はまず、トレーニング データ セット内の各データ ポイントの空間座標と他のデータ ポイントの空間座標の間の距離を計算し、これを入力として使用してドロップアウト正則化を実行し、過学習を防止します。
第二に、この研究では、ニューラルネットワークによって出力された空間重みベクトルと、最小二乗法から導出された係数および独立変数の値に対してドット積演算を実行し、ロジスティック回帰関数を適用して最終的な予測値を生成します。
最終的に、この研究ではバイナリ クロスエントロピー損失関数を使用して実際の値と比較した損失を計算し、これを使用してニューラル ネットワークが負のフィードバック調整を行うようにガイドします。

この研究では、研究者らは、最も一般的な地理的加重回帰 (GWR)、サポート ベクター マシン (SVM)、ランダム フォレスト (RF)、地理的重み付けロジスティック回帰 (GWLR)、地理的重み付けサポート ベクター回帰 (GWSVR)、ランダム フォレストも対象としました。比較用の(GWRF)モデル。
具体的には、この研究では 5 重交差検証を使用して 20 の鉱物鉱床を 5 つのシーケンスにランダムに分割し、各シーケンスには 4 つの鉱物鉱床があり、これらの 4 つの鉱物鉱床を半径 2km のバッファー分析でバッファリングして、各シーケンスの陽性サンプルを取得しました。 。同様に、この研究では、陽性サンプルの数を一致させて、陰性サンプルプールから陰性サンプルをランダムに選択し、各陰性サンプルは 5 分割相互検証で 1 回だけ出現しました。
5 重交差検証理論によれば、4 つのサンプル セットをトレーニングに使用し、1 つのサンプル セットを検証に使用します。このプロセスを 5 回繰り返し、各シーケンスを検証セットとして使用します。 5 分割相互検証は、セットと検証セットがマージされます。
結果から、GNNWLR モデルによるニューラル ネットワークの効果的な統合により、GNNWLR は他のモデルよりも大幅に優れており、鉱物分類において優れたフィッティングおよび予測能力を示し、AUC は 0.913 (他のモデルより 5% ~ 16% 高い) です。同時に、GWRF と GWSVR は RF や SVM よりも大幅に優れています。これは、両方とも地理加重回帰 (GWR) が組み込まれているためと考えられます。これは、空間変数間の局所的な関係をより正確に記述することができます。

また、すべてのモデルの MPM プロットは、ノバスコシア州の鉱物の見通しには大きな空間的な違いがあり、全体的に北東部のスコアが高く、鉱床の実際の位置と一致していることを直感的に示しています。しかし、集中地域から遠く離れた金資源に直面している GNNWLR は、他のモデルでは簡単に無視されるより多くの鉱床を発見できます。
たとえば、「領域 1」の GNNWLR スコアは 0.985 と高くなりますが、GWSVR、GWRF、GWLR、SVM、RF、GWR モデルの対応するスコアはわずか 0.288、0438、0.471、0.133、0.383、0.290 です。

さらに、RF モデルと SVM モデルは「領域 2」と「領域 3」で突然のジャンプを示し、精度と信頼性に影響を与えます。 GNNWLR、GWLR、および GWR モデルは、石灰化因子の空間的近接性と不均一性を考慮に入れており、従来の機械学習モデルでよく見られる突然変異の発生を防ぐことができます。 GNNWLR は、これらの要因間の複雑な非線形関係、特に空間変動に関連する関係を捕捉する際に優れた能力を発揮することが観察されています。
したがって、GNNWLR は、鉱物の見通しの予測において比較的シームレスな移行を示し、経験的データと一致するより高い精度と一貫性を示しています。
SHAPは石化に影響を与える要因を定量的に分析できます
モデル評価の解釈可能性を向上させるために、この研究では、データセット全体からの一連の陽性サンプルを統合して使用し、GNNWLR の関連する場所での鉱物見通しの特性を計算します。
結果は、As がモデルの出力に最も大きな影響を及ぼし、SHAP 値と正の相関があることを示しています。これは、As が低いためである可能性があります。 -温度熱水要素。金の堆積物にしばしば関連付けられます。同様に、Zn は多くの鉱山現場に悪影響を及ぼしますが、Cu は最も重大な影響を及ぼしません。このうち、As、Pb はレアルガー、方鉛鉱などの鉱物に伴う低温熱水元素であり、Zn、Cu は閃亜鉛鉱、黄銅鉱などの鉱物を形成する中温熱水元素です。要約すると、この地域での金鉱床の形成は低温熱水プロセスと密接に関係しています。

この研究では、さまざまな地域のさまざまな特性の鉱化作用を評価することにより、「エリア 4」の鉱化作用が背斜と Pb に強く関連していることがわかりました。「エリア 5」には 2 つの鉱床があり、そのうち北の鉱床は Pb の影響を受けています。 Cu、Pb、Zn、As および As の 4 つの元素のプラスの影響は、この低域が中温と低温の熱水鉱化作用の両方を持っていることを示しており、南部の鉱床は Zn と As によってプラスの影響を受けており、中温の熱水が優勢であることを示しています。
ノバスコシア州天然資源局の掘削データと組み合わせると、「エリア 5」の北部鉱床には、さまざまな低温および中温熱水鉱物を含む、金鉱山に関連する 39 件の地質掘削記録が含まれています。 「エリア5」は金鉱山に関するもので、該当する地質掘削記録は4件のみであり、鉱床エリアには硫化物や黄鉄鉱などの中温熱水鉱物が主に含まれている。 「エリア 6」の鉱化は背斜接触と密接に関係しており、SHAP 値の空間分布に基づく鉱化タイプの推定も裏付けられます。

要約すると、SHAP値に基づくモデルは、空間領域全体の鉱化結果に影響を与えるさまざまな要因を定量的に分析でき、優れた解釈可能性を持ち、地球科学の原則と一致しています。同時に、この研究ではSHAP値と回帰係数の空間分布プロットも比較しました。結果は、回帰係数の空間分布が地質学的法則に完全には準拠していないことを示しています。したがって、SHAP 値は従来の回帰係数よりも意味があり、学者にとって参照しやすいものです。

浙江大学のDu Zhenhong教授:時空間ビッグデータと人工知能の研究に注力
浙江大学地球科学院のDu Zhenhong教授が率いる研究チームは、リモートセンシングと地理情報システム、時空間ビッグデータ、人工知能に関する科学研究に長年取り組んできており、技術研究において一連の成果を達成した。 、そしてチームは、GIS、リモートセンシング、コンピュータサイエンスと地理学、海洋学、地質学などを完全に統合し、データ駆動型地球科学開発の探索における新たな章を開始するようチームを率いています。
参考文献:
1.https://www.zast.org.cn/art/2022/12/8/art_1675105_58963288.html