Besser Als Die Fünf Fortgeschrittenen Modelle Ist Das Von Du Zhenhongs Team an Der Zhejiang-Universität Vorgeschlagene GNNWLR-Modell: Verbesserung Der Genauigkeit Der Mineralisierungsvorhersage

Katar hatte sich im Jahr 2010 das Recht gesichert, die Fußballweltmeisterschaft auszurichten. Im Jahr 2022 wurde sie mit einer Gesamtinvestition von rund 229 Milliarden US-Dollar erfolgreich abgehalten. Im Vergleich dazu betrugen die Gesamtkosten der letzten sieben Weltmeisterschaften nur etwa 40 Milliarden Dollar. Dieses Sportereignis zeichnet sich durch einen extravaganten Stil aus, der letztlich auf das tiefgreifende Erbe des Landes Katar zurückzuführen ist. Wie heißt es so schön: „Wer eine Mine zu Hause hat, hat keine Sorgen.“ Dank seiner reichen Bodenschätze konnte Katar großzügig Geld ausgeben und eine Reihe audiovisueller Feste schaffen.
Für den Einzelnen bedeuten Bodenschätze einen unerschöpflichen Reichtum, der faszinierend ist; Für die Gesellschaft sind sie eine wichtige Säule der wirtschaftlichen und sozialen Entwicklung und stehen in Zusammenhang mit der Volkswirtschaft, dem Lebensunterhalt der Menschen und der nationalen Sicherheit. Allerdings sind Bodenschätze nicht ohne weiteres verfügbar. Sie liegen Hunderte von Metern unter der Erde verborgen und die Suche nach den wertvollen Bodenschätzen erfordert oft viel harte Arbeit.
Mit der kontinuierlichen Entwicklung der Mineralexploration hat die Branche schrittweise einen Forschungsweg entwickelt, der sich am „Erzbildungssystem – Explorationssystem – Vorhersage- und Bewertungssystem“ orientiert. Obwohl künstliche Intelligenz in Systemen zur Vorhersage und Bewertung mineralischer Ressourcen (MPM) eine immer wichtigere Rolle spielt, unterliegt ihre Anwendung immer noch gewissen Einschränkungen, die es Geologen oft schwer machen, den Endergebnissen zu vertrauen.
Um die Interpretierbarkeit von Mineralisierungsvorhersagemodellen und die durch geologische Faktoren im Mineralisierungsprozess verursachte räumliche Nichtstationarität zu verbessern,Ein Forschungsteam der Zhejiang-Universität hat eine neue Methode der georäumlichen künstlichen Intelligenz vorgeschlagen: die geographisch neuronale Netzwerk-gewichtete logistische Regression (GNNWLR).
Das Modell integriert räumliche Muster und neuronale Netzwerke und kann in Kombination mit Shapleys additiver Interpretationstheorie nicht nur die Genauigkeit von Vorhersagen erheblich verbessern, sondern auch die Interpretierbarkeit von Mineralienvorhersagen in komplexen räumlichen Szenarien verbessern.

Forschungshighlights
* Ein geografisches neuronales Netzwerk gewichtetes logistisches Regressionsmodell GNNWLR wird vorgeschlagen
* GNNWLR übertrifft andere fortschrittliche Modelle bei der Vorhersage und Bewertung von Mineralressourcen
* GNNWLR überwindet räumliche Heterogenität und nichtlineare Effekte
* GNNWLR verbessert die Interpretierbarkeit künstlicher Intelligenz für Mineralisierungsmechanismen

Papieradresse:
https://doi.org/10.1016/j.jag.2024.103746
Folgen Sie dem offiziellen Account und antworten Sie mit „Erzbildungsvorhersage“, um das vollständige PDF zu erhalten
Wettbewerb um den globalen MPM-Teststandort: Meguma, Nova Scotia, Kanada
Der Schwerpunkt der Studie lag auf der Meguma-Gruppe, einem etwa 7.800 Quadratkilometer großen Gebiet im Westen von Nova Scotia, Kanada, das hauptsächlich von Grasland und Wäldern bedeckt ist. Das Meguma-Terran besteht aus zwei Formationen, die untere ist die Goldenville-Group-Formation, die hauptsächlich aus metamorphem Sandstein besteht. Die obere Schicht ist die Formation der Halifax-Gruppe, die aus komplexen Schiefergesteinen besteht.
Als Folge der akadischen Orogenese und der Ablagerung devonischer Granite hat sich in dem Gebiet eine Reihe von nordöstlich und südwestlich verlaufenden Faltenstrukturen gebildet, die zu einem Testgelände für eine Vielzahl von Systemen zur Vorhersage und Bewertung mineralischer Ressourcen geworden sind.

Im Untersuchungsgebiet gibt es 20 Turbidit-Goldvorkommen. daher,Die Studie verwendete sechs charakteristische Schichten, darunter antiklinale Strukturfaktoren, Kontaktfaktoren zwischen den Goldenville- und Halifax-Formationen sowie chemische Elemente wie Kupfer (Cu), Blei (Pb), Arsen (As) und Zink (Zn).
Im Rahmen der Studie wurde eine Pufferanalyse mit mehreren Ringen auf der Antiklinale und der Kontaktfläche zwischen den Formationen Goldenville und Halifax durchgeführt. Dabei wurden in Abständen von 0,5 km entsprechende Gewichte zugewiesen, sodass insgesamt 16 Pufferringe entstanden. Gleichzeitig wurde im Rahmen der Studie auch eine inverse distanzgewichtete Interpolation (IDW) an 671 Seesedimentproben durchgeführt, die chemische Elemente enthielten. Abschließend wurde im Rahmen der Studie das gesamte Untersuchungsgebiet gerastert und alle Feature-Layer in Rasterdaten von 1 km x 1 km vereinheitlicht.
Da 20 positive Proben im Verhältnis zum gesamten Untersuchungsgebiet immer noch zu wenig sind, ist eher mit einem unausgewogenen Verhältnis von positiven und negativen Proben zu rechnen. Daher wurde in dieser Studie auch die Pufferzone analysiert, indem ein Radius von 2 km um die 20 positiven Probenahmepunkte herum abgegrenzt wurde, und anschließend eine Rasteranalyse durchgeführt.
Letztendlich ergab die Studie 245 positive Proben, die auf das Vorhandensein von Mineralvorkommen hinwiesen, der Rest zeigte deren Abwesenheit an. Gleichzeitig wählte die Studie zufällig dieselbe Datenmenge wie die positiven Proben aus dem negativen Probensatz aus und führte sie mit den positiven Proben zusammen, um einen Trainingssatz und einen Validierungssatz zu erstellen.
GNNWR-Modell: Effizientes Ensemble neuronaler Netzwerke
Da die Modellstruktur der gewichteten Regression mit geografischen neuronalen Netzwerken (GNNWR) den mittleren quadratischen Fehler verwendet, kann die direkte Anwendung dieser Methode auf die Vorhersage und Bewertung mineralischer Ressourcen Konvergenzprobleme mit sich bringen. Untersuchungen haben gezeigt, dass die Kreuzentropie mehr praktische Vorteile bietet als der mittlere quadratische Fehler. daher,In der Studie wurde eine speziell für die logistische Regression entwickelte Verlustfunktion verwendet – die binäre Kreuzentropie (BCE).
In diesem Zusammenhang berechnet GNNWLR zunächst den Abstand zwischen den räumlichen Koordinaten jedes Datenpunkts und den räumlichen Koordinaten anderer Datenpunkte im Trainingsdatensatz und verwendet diesen als Eingabe, um eine Dropout-Regularisierung durchzuführen und eine Überanpassung zu verhindern.
Zweitens führte die Studie eine Skalarproduktoperation mit dem vom neuronalen Netzwerk ausgegebenen räumlichen Gewichtungsvektor, den mit der Methode der kleinsten Quadrate erhaltenen Koeffizienten und den Werten der unabhängigen Variablen durch und wandte dann die logistische Regressionsfunktion an, um den endgültigen Vorhersagewert zu generieren.
Schließlich wurde in der Studie eine binäre Kreuzentropie-Verlustfunktion verwendet, um den Verlust im Verhältnis zum tatsächlichen Wert zu berechnen und das neuronale Netzwerk bei der Durchführung negativer Rückkopplungsanpassungen anzuleiten.

In dieser Studie verglichen die Forscher auch die gängigsten Modelle: geografisch gewichtete Regression (GWR), Support Vector Machine (SVM), Random Forest (RF), geografisch gewichtete logistische Regression (GWLR), geografisch gewichtete Support Vector Regression (GWSVR) und Random Forest (GWRF).
Im Einzelnen wurden in dieser Studie die 20 Lagerstätten mittels fünffacher Kreuzvalidierung zufällig in 5 Sequenzen mit jeweils 4 Lagerstätten aufgeteilt. Anschließend wurde für diese 4 Lagerstätten eine Pufferanalyse mit einem Pufferradius von 2 km durchgeführt, um für jede Sequenz positive Proben zu erhalten. In ähnlicher Weise wurden in dieser Studie auch negative Proben zufällig aus dem Pool negativer Proben ausgewählt, indem die Anzahl der positiven Proben abgeglichen wurde, und jede negative Probe erschien bei der fünffachen Kreuzvalidierung nur einmal.
Gemäß der Theorie der fünffachen Kreuzvalidierung werden vier Stichprobensätze für das Training und ein Stichprobensatz für die Validierung verwendet. Dieser Vorgang wird fünfmal wiederholt, wobei jede Sequenz als Validierungssatz dient. Abschließend werden der Trainingssatz und der Validierungssatz, die durch die fünffache Kreuzvalidierung erhalten wurden, zusammengeführt.
Aus den ErgebnissenAufgrund der effektiven Integration neuronaler Netzwerke in das GNNWLR-Modell übertrifft GNNWLR andere Modelle deutlich und zeigt hervorragende Anpassungs- und Vorhersagefähigkeiten bei der Mineralklassifizierung mit einem AUC von 0,913, der 5%-16% höher ist als bei anderen Modellen.Mittlerweile sind GWRF und GWSVR auch deutlich besser als RF und SVM, was daran liegen könnte, dass beide mit der geografisch gewichteten Regression (GWR) kombiniert werden, die die lokale Beziehung zwischen räumlichen Variablen genauer beschreiben kann.

Die MPM-Karten für alle Modelle zeigen auch visuell, dass es in Nova Scotia erhebliche räumliche Unterschiede bei der Mineralvorkommenheit gibt, wobei die nordöstliche Region insgesamt höhere Werte erzielt, was mit der tatsächlichen Lage der Lagerstätten übereinstimmt. Jedoch,Angesichts der Goldvorkommen, die weit entfernt von konzentrierten Gebieten liegen, kann GNNWLR weitere Lagerstätten entdecken, die von anderen Modellen leicht übersehen werden.
Beispielsweise beträgt der Wert von GNNWLR in „Region 1“ 0,985, während die entsprechenden Werte der Modelle GWSVR, GWRF, GWLR, SVM, RF und GWR nur 0,288, 0,438, 0,471, 0,133, 0,383 und 0,290 betragen.

Darüber hinaus weisen die RF- und SVM-Modelle in „Region 2“ und „Region 3“ plötzliche Sprünge auf, was ihre Genauigkeit und Zuverlässigkeit beeinträchtigt. Die Modelle GNNWLR, GWLR und GWR berücksichtigen die räumliche Nähe und Heterogenität von Mineralisierungsfaktoren, wodurch das Auftreten von Mutationen verhindert werden kann, die in herkömmlichen Modellen des maschinellen Lernens häufig vorkommen. Es wurde beobachtet, dass GNNWLR über hervorragende Fähigkeiten bei der Erfassung der komplexen nichtlinearen Beziehungen zwischen diesen Faktoren verfügt, insbesondere jener, die mit räumlichen Variationen zusammenhängen.
daher,GNNWLR demonstriert einen relativ nahtlosen Übergang bei der Vorhersage der Mineralprospektivität und weist eine höhere Genauigkeit und Übereinstimmung mit empirischen Daten auf.
SHAP kann die Faktoren, die die Mineralisierung beeinflussen, quantitativ analysieren
Um die Interpretierbarkeit der Modellbewertung zu verbessern, wurde in dieser Studie der positive Probensatz des gesamten Datensatzes integriert und verwendet, um die Mineralvorkommensmerkmale relevanter Standorte in GNNWLR zu berechnen.
Die Ergebnisse zeigen, dass As den größten Einfluss auf die Modellausgabe hat und positiv mit dem SHAP-Wert korreliert. Je höher der As-Wert, desto höher der SHAP-Wert und desto größer die Möglichkeit einer Mineralisierung. Dies kann daran liegen, dass As ein hydrothermales Element mit niedriger Temperatur ist und oft mit Goldvorkommen in Verbindung gebracht wird. Ebenso hatte Zn in vielen Bergbaugebieten negative Auswirkungen, während Cu die geringsten Auswirkungen hatte. Unter ihnen sind As und Pb hydrothermale Elemente mit niedriger Temperatur, die mit Mineralien wie Realgar und Galenit in Verbindung stehen, während Zn und Cu hydrothermale Elemente mit mittlerer Temperatur sind, die Mineralien wie Sphalerit und Chalkopyrit bilden.Zusammenfassend lässt sich sagen, dass die Bildung von Goldvorkommen in diesem Gebiet eng mit hydrothermalen Prozessen bei niedrigen Temperaturen zusammenhängt.

Durch die Bewertung der Auswirkungen von Mineralisierungen mit unterschiedlichen Eigenschaften in verschiedenen Gebieten ergab die Studie, dass die Mineralisierung in „Gebiet 4“ stark mit Antiklinen und Pb korreliert und dass es in „Gebiet 5“ zwei Mineralvorkommen gibt. Die nördliche Lagerstätte wird positiv von den vier Elementen Cu, Pb, Zn und As beeinflusst, was darauf hindeutet, dass das tiefer gelegene Gebiet sowohl eine hydrothermale Mineralisierung mittlerer als auch niedriger Temperatur aufweist. Die südliche Lagerstätte wird positiv durch Zn und As beeinflusst, was darauf hindeutet, dass hydrothermale Flüssigkeiten mittlerer Temperatur die Hauptursache sind.
Zusammen mit den Bohrdaten des Nova Scotia Department of Natural Resources gibt es 39 geologische Bohraufzeichnungen im Zusammenhang mit Goldminen in den nördlichen Lagerstätten der „Region 5“, die eine Vielzahl von hydrothermalen Mineralien mit niedriger und mittlerer Temperatur beinhalten. Es gibt nur 4 geologische Bohraufzeichnungen im Zusammenhang mit Goldminen in den südlichen Lagerstätten der „Region 5“. Das Lagerstättengebiet enthält hauptsächlich mitteltemperierte hydrothermale Mineralien wie Sulfide und Arsenopyrit. Die Mineralisierung in Gebiet 6 steht in engem Zusammenhang mit dem Antiklinenkontakt, was auch die Schlussfolgerung hinsichtlich des Mineralisierungstyps auf Grundlage der räumlichen Verteilung der SHAP-Werte bestätigt.

Zusammenfassend lässt sich sagen, dass das auf dem SHAP-Wert basierende Modell verschiedene Faktoren, die die Mineralisierungsergebnisse im gesamten räumlichen Bereich beeinflussen, quantitativ analysieren kann, eine hervorragende Interpretierbarkeit aufweist und mit den Prinzipien der Geowissenschaften übereinstimmt.Gleichzeitig wurden in dieser Studie auch die räumlichen Verteilungskarten der SHAP-Werte und Regressionskoeffizienten verglichen. Die Ergebnisse zeigen, dass die räumliche Verteilung der Regressionskoeffizienten nicht vollständig den geologischen Gesetzen entspricht. Daher sind SHAP-Werte aussagekräftiger und für Wissenschaftler leichter zu referenzieren als herkömmliche Regressionskoeffizienten.

Professor Du Zhenhong von der Zhejiang-Universität: Schwerpunkt auf der Forschung zu raumzeitlichen Big Data und künstlicher Intelligenz
Das Forschungsteam unter der Leitung von Professor Du Zhenhong von der Fakultät für Geowissenschaften der Zhejiang-Universität betreibt seit langem wissenschaftliche Forschung in den Bereichen Fernerkundung und geografische Informationssysteme, raumzeitliche Big Data und künstliche Intelligenz und hat eine Reihe von Ergebnissen in der Grundlagenforschung und Schlüsseltechnologie der raumzeitlichen Big Data-Analyse in den Bereichen Geographie, Ozean, geologische Katastrophen usw. erzielt. Er leitet das Team bei der vollständigen Integration von GIS, Fernerkundung und Informatik mit Geographie, Ozean, Geologie usw. und schlägt ein neues Kapitel in der Entwicklung datengesteuerter Geowissenschaften auf.
Quellen:
1.https://www.zast.org.cn/art/2022/12/8/art_1675105_58963288.html