Meilleur Que Les Cinq Modèles Avancés, Le Modèle GNNWLR Proposé Par L'équipe De Du Zhenhong À L'université Du Zhejiang : Améliore La Précision De La Prédiction De La Minéralisation

Le Qatar a obtenu le droit d'accueillir la Coupe du monde en 2010 et celle-ci a été organisée avec succès en 2022, avec un investissement total d'environ 229 milliards de dollars américains. En comparaison, le coût total des sept Coupes du monde précédentes n’était que d’environ 40 milliards de dollars. Cet événement sportif affiche un style extravagant, qui découle en fin de compte du profond héritage du pays du Qatar. Comme le dit le proverbe : « Si vous avez une mine à la maison, vous n’aurez aucun souci. » Le Qatar peut dépenser son argent librement et créer une série de spectacles audiovisuels grâce à ses riches ressources minérales.
Pour les individus, les ressources minérales représentent une richesse inépuisable, ce qui est fascinant ; Pour la société, ils constituent un pilier important du développement économique et social et sont liés à l’économie nationale, aux moyens de subsistance de la population et à la sécurité nationale. Cependant, les ressources minérales ne sont pas facilement disponibles. Ils sont cachés à des centaines de mètres sous terre, et il faut souvent beaucoup de travail pour les explorer et en extraire les précieuses ressources minérales.
Avec le développement continu de l'exploration minière, l'industrie a progressivement formé une voie de recherche guidée par « système de formation de minerai-système d'exploration-système de prédiction et d'évaluation ». Bien que l’intelligence artificielle joue un rôle de plus en plus important dans les systèmes de prédiction et d’évaluation des ressources minérales (MPM), son application présente encore certaines limites, qui rendent souvent difficile pour les géologues de faire confiance aux résultats finaux.
Afin d'améliorer l'interprétabilité des modèles de prédiction de la minéralisation et la non-stationnarité spatiale causée par des facteurs géologiques dans le processus de minéralisation,Une équipe de recherche de l'Université du Zhejiang a proposé une nouvelle méthode d'intelligence artificielle géospatiale : la régression logistique pondérée par un réseau neuronal géographique (GNNWLR).
Le modèle intègre des modèles spatiaux et des réseaux neuronaux et, combiné à la théorie d'interprétation additive de Shapley, il peut non seulement améliorer considérablement la précision des prédictions, mais également améliorer l'interprétabilité des prédictions minérales dans des scénarios spatiaux complexes.

Points saillants de la recherche
* Un modèle de régression logistique pondéré par réseau neuronal géographique GNNWLR est proposé
* GNNWLR surpasse les autres modèles avancés en matière de prédiction et d'évaluation des ressources minérales
* GNNWLR surmonte l'hétérogénéité spatiale et les effets non linéaires
* GNNWLR améliore l'interprétabilité de l'intelligence artificielle pour les mécanismes de minéralisation

Adresse du document :
https://doi.org/10.1016/j.jag.2024.103746
Suivez le compte officiel et répondez « prédiction de formation de minerai » pour obtenir le PDF complet
En compétition pour le site d'essai mondial du MPM : Meguma, Nouvelle-Écosse, Canada
L'étude s'est concentrée sur le groupe Meguma, une zone d'environ 7 800 kilomètres carrés dans l'ouest de la Nouvelle-Écosse, au Canada, qui est principalement couverte de prairies et de forêts. Le terrane de Meguma est constitué de deux formations, la plus basse étant la formation du groupe Goldenville, qui est principalement composée de grès métamorphisé. La couche supérieure est la formation du groupe Halifax, qui est constituée de roches complexes de schiste.
À la suite de l'orogenèse acadienne et de la mise en place de granites dévoniens, une série de structures de plis orientées NE-SW se sont formées dans la région, qui est devenue un terrain d'essai pour une variété de systèmes de prédiction et d'évaluation des ressources minérales.

Il y a 20 gisements d’or turbiditiques dans la zone d’étude. donc,L’étude a utilisé six couches caractéristiques, y compris les facteurs structurels anticlinaux, les facteurs de contact entre les formations de Goldenville et d’Halifax et les éléments chimiques tels que le cuivre (Cu), le plomb (Pb), l’arsenic (As) et le zinc (Zn).
L'étude a mené une analyse tampon à anneaux multiples sur l'anticlinal et la surface de contact entre les formations de Goldenville et d'Halifax, en attribuant des poids correspondants à des intervalles de 0,5 km, formant un total de 16 anneaux tampons. Parallèlement, l’étude a également réalisé une interpolation pondérée par la distance inverse (IDW) sur 671 échantillons de sédiments lacustres contenant des éléments chimiques. Enfin, l’étude a quadrillé l’ensemble de la zone d’étude et unifié toutes les couches de caractéristiques dans des données de grille de 1 km x 1 km.
Étant donné que 20 échantillons positifs sont encore trop petits par rapport à l’ensemble de la zone d’étude, le rapport entre les échantillons positifs et négatifs est plus susceptible d’être déséquilibré. Par conséquent, cette étude a également analysé la zone tampon, en divisant un rayon de 2 km autour des 20 points d’échantillonnage positifs, puis a effectué une analyse raster.
Au final, l’étude a donné 245 échantillons positifs, indiquant la présence de gisements minéraux, et le reste indiquant leur absence. Dans le même temps, l’étude a sélectionné au hasard la même quantité de données que les échantillons positifs de l’ensemble d’échantillons négatifs et les a fusionnées avec les échantillons positifs pour créer un ensemble d’entraînement et un ensemble de validation.
Modèle GNNWR : ensemble efficace de réseaux neuronaux
Étant donné que la structure du modèle de régression pondérée par réseau neuronal géographique (GNNWR) utilise l’erreur quadratique moyenne, son application directe à la prédiction et à l’évaluation des ressources minérales peut entraîner des défis de convergence. Des recherches ont montré que l’entropie croisée présente plus d’avantages pratiques que l’erreur quadratique moyenne. donc,L’étude a utilisé une fonction de perte spécialement conçue pour la régression logistique : l’entropie croisée binaire (BCE).
Dans ce contexte, GNNWLR calcule d'abord la distance entre les coordonnées spatiales de chaque point de données et les coordonnées spatiales d'autres points de données dans l'ensemble de données d'entraînement, et l'utilise comme entrée pour effectuer une régularisation des abandons et éviter le surajustement.
Deuxièmement, l'étude a effectué une opération de produit scalaire sur le vecteur de poids spatial produit par le réseau neuronal, les coefficients obtenus par la méthode des moindres carrés et les valeurs des variables indépendantes, puis a appliqué la fonction de régression logistique pour générer la valeur de prédiction finale.
Enfin, l’étude a utilisé une fonction de perte d’entropie croisée binaire pour calculer la perte par rapport à la valeur réelle et l’a utilisée pour guider le réseau neuronal afin d’effectuer des ajustements de rétroaction négative.

Dans cette étude, les chercheurs ont également comparé les modèles de régression pondérée géographiquement (GWR), de machine à vecteurs de support (SVM), de forêt aléatoire (RF), de régression logistique pondérée géographiquement (GWLR), de régression à vecteurs de support pondérée géographiquement (GWSVR) et de forêt aléatoire (GWRF) les plus courants.
Plus précisément, cette étude a utilisé une validation croisée en cinq étapes pour diviser aléatoirement les 20 dépôts en 5 séquences, chacune avec 4 dépôts, puis a effectué une analyse tampon sur ces 4 dépôts avec un rayon tampon de 2 km pour obtenir des échantillons positifs pour chaque séquence. De même, cette étude a également sélectionné de manière aléatoire des échantillons négatifs dans le pool d’échantillons négatifs en faisant correspondre le nombre d’échantillons positifs, et chaque échantillon négatif n’est apparu qu’une seule fois dans la validation croisée en cinq volets.
Selon la théorie de validation croisée en cinq volets, quatre ensembles d’échantillons sont utilisés pour la formation et un ensemble d’échantillons est utilisé pour la validation. Ce processus est répété cinq fois, chaque séquence servant d’ensemble de validation. Enfin, l’ensemble d’entraînement et l’ensemble de validation obtenus par la validation croisée quintuple sont fusionnés.
D'après les résultats,En raison de l'intégration efficace des réseaux neuronaux dans le modèle GNNWLR, GNNWLR surpasse considérablement les autres modèles et présente d'excellentes capacités d'ajustement et de prédiction dans la classification des minéraux, avec une AUC de 0,913, soit 5%-16% de plus que les autres modèles.Parallèlement, GWRF et GWSVR sont également nettement meilleurs que RF et SVM, ce qui peut être dû au fait qu'ils sont tous deux combinés à une régression pondérée géographiquement (GWR), qui peut décrire plus précisément la relation locale entre les variables spatiales.

Les cartes MPM pour tous les modèles démontrent également visuellement qu’il existe une variation spatiale considérable dans la prospectivité minérale en Nouvelle-Écosse, la région nord-est obtenant un score global plus élevé, ce qui correspond à l’emplacement réel des gisements. Cependant,Face à des ressources aurifères éloignées des zones concentrées, GNNWLR peut découvrir davantage de gisements qui sont facilement négligés par d’autres modèles.
Par exemple, le score de GNNWLR dans la « Région 1 » est aussi élevé que 0,985, tandis que les scores correspondants des modèles GWSVR, GWRF, GWLR, SVM, RF et GWR ne sont que de 0,288, 0,438, 0,471, 0,133, 0,383 et 0,290.

De plus, les modèles RF et SVM présentent des sauts soudains dans la « région 2 » et la « région 3 », ce qui affecte leur précision et leur fiabilité. Les modèles GNNWLR, GWLR et GWR prennent en compte la proximité spatiale et l’hétérogénéité des facteurs de minéralisation, ce qui peut empêcher l’apparition de mutations courantes dans les modèles d’apprentissage automatique traditionnels. Il est observé que GNNWLR présente une capacité supérieure à capturer les relations non linéaires complexes entre ces facteurs, en particulier celles liées aux variations spatiales.
donc,Le GNNWLR démontre une transition relativement transparente dans la prédiction de la prospectivité minérale, montrant une précision et une cohérence supérieures avec les données empiriques.
SHAP peut analyser quantitativement les facteurs affectant la minéralisation
Afin d’améliorer l’interprétabilité de l’évaluation du modèle, cette étude a intégré et utilisé l’ensemble d’échantillons positifs de l’ensemble de données pour calculer les caractéristiques des perspectives minérales des emplacements pertinents dans le GNNWLR.
Les résultats montrent que As a le plus grand impact sur la sortie du modèle et est positivement corrélé avec la valeur SHAP. Plus la valeur As est élevée, plus la valeur SHAP est élevée et plus la possibilité de minéralisation est grande. Cela peut être dû au fait que l’As est un élément hydrothermal à basse température et qu’il est souvent associé aux gisements d’or. De même, le Zn a eu un impact négatif sur de nombreuses zones minières, tandis que le Cu a eu l’impact le moins significatif. Parmi eux, As et Pb sont des éléments hydrothermaux à basse température associés à des minéraux tels que le réalgar et la galène, tandis que Zn et Cu sont des éléments hydrothermaux à température moyenne qui forment des minéraux tels que la sphalérite et la chalcopyrite.En résumé, la formation de gisements d’or dans cette zone est étroitement liée aux processus hydrothermaux à basse température.

En évaluant l'impact de la minéralisation avec différentes caractéristiques dans différentes zones, l'étude a révélé que la minéralisation dans la « zone 4 » est fortement corrélée aux anticlinaux et au Pb, et qu'il existe deux gisements minéraux dans la « zone 5 ». Le gisement nord est positivement affecté par les quatre éléments Cu, Pb, Zn et As, ce qui indique que la zone basse présente à la fois une minéralisation hydrothermale à température moyenne et à basse température ; le gisement sud est positivement affecté par le Zn et l'As, indiquant que les fluides hydrothermaux à température moyenne sont les principaux.
Combinés aux données de forage du ministère des Ressources naturelles de la Nouvelle-Écosse, il existe 39 enregistrements de forage géologique liés aux mines d'or dans les gisements du nord de la « région 5 », impliquant une variété de minéraux hydrothermaux à basse et moyenne température. Il n'existe que 4 enregistrements de forage géologique liés aux mines d'or dans les gisements du sud de la « Région 5 ». La zone du gisement contient principalement des minéraux hydrothermaux à température moyenne tels que des sulfures et de l'arsénopyrite. La minéralisation de la zone 6 est étroitement liée au contact anticlinal, ce qui confirme également l’inférence du type de minéralisation basée sur la distribution spatiale des valeurs SHAP.

En résumé, le modèle basé sur la valeur SHAP peut analyser quantitativement divers facteurs affectant les résultats de minéralisation dans l’ensemble du domaine spatial, présente une excellente interprétabilité et est cohérent avec les principes des sciences de la Terre.Parallèlement, cette étude a également comparé les cartes de distribution spatiale des valeurs SHAP et des coefficients de régression. Les résultats montrent que la distribution spatiale des coefficients de régression n’est pas entièrement conforme aux lois géologiques. Par conséquent, les valeurs SHAP sont plus significatives et plus faciles à consulter pour les chercheurs que les coefficients de régression traditionnels.

Professeur Du Zhenhong de l'Université du Zhejiang : Se concentrer sur la recherche sur les mégadonnées spatio-temporelles et l'intelligence artificielle
L'équipe de recherche dirigée par le professeur Du Zhenhong de l'École des sciences de la Terre de l'Université du Zhejiang est engagée depuis longtemps dans la recherche scientifique sur la télédétection et les systèmes d'information géographique, les mégadonnées spatio-temporelles et l'intelligence artificielle, et a obtenu une série de résultats dans la théorie fondamentale et la recherche technologique clé de l'analyse des mégadonnées spatio-temporelles dans les domaines de la géographie, de l'océan, des catastrophes géologiques, etc. Il dirige l'équipe pour intégrer pleinement les SIG, la télédétection, l'informatique avec la géographie, l'océan, la géologie, etc., et explorer un nouveau chapitre dans le développement des sciences de la Terre axées sur les données.
Références :
1.https://www.zast.org.cn/art/2022/12/8/art_1675105_58963288.html