HyperAI초신경

저장대학교 두진홍 연구팀이 제안한 GNNWLR 모델은 기존 5개 고급 모델보다 우수해 광화 예측 정확도 향상

特色图像

카타르는 2010년 월드컵 개최권을 획득했으며, 2022년에도 약 2,290억 달러의 총 투자를 통해 성공적으로 개최되었습니다. 비교해 보면, 지난 7번의 월드컵 개최 비용은 총 400억 달러에 불과했습니다. 이 스포츠 이벤트는 카타르 국가의 깊은 유산에서 비롯된 화려한 스타일을 보여줍니다. 속담에 "집에 지뢰가 있으면 걱정이 없다"고 하더군요. 카타르는 풍부한 광물 자원 덕분에 돈을 마음껏 쓰고, 다양한 시청각적 향연을 벌일 수 있었습니다.

개인에게 있어서 광물자원은 무한한 부를 의미하는데, 이는 매우 흥미로운 일입니다. 사회 측면에서 보면, 이들은 경제 및 사회 발전의 중요한 기둥이며, 국민경제, 국민생활, 국가 안보와 관련이 있습니다. 하지만 광물자원은 쉽게 구할 수 없습니다. 이들은 수백 미터 지하에 숨겨져 있으며, 귀중한 광물 자원을 탐사하려면 많은 노력이 필요한 경우가 많습니다.

광물 탐사의 지속적인 발전에 따라 업계는 점차 "광석 형성 시스템-탐사 시스템-예측 평가 시스템"을 중심으로 하는 연구 경로를 형성해 왔습니다. 인공 지능이 광물 자원 예측 및 평가(MPM) 시스템에서 점점 더 중요한 역할을 하고 있지만, 여전히 특정 한계가 있어 지질학자들이 최종 결과를 신뢰하기 어려울 때가 많습니다.

광물화 예측 모델의 해석성과 광물화 과정에서 지질학적 요인에 의해 발생하는 공간적 비정상성을 개선하기 위해,저장대학 연구팀은 새로운 지리공간 인공지능 방법인 지리신경망 가중 로지스틱 회귀(GNNWLR)를 제안했습니다.

이 모델은 공간 패턴과 신경망을 통합하고, 샤플리의 가산적 해석 이론과 결합하면 예측의 정확도를 크게 향상시킬 수 있을 뿐만 아니라 복잡한 공간 시나리오에서 광물 예측의 해석 가능성도 개선할 수 있습니다.

MPM 프로세스

연구 하이라이트

* 지리적 신경망 가중 로지스틱 회귀 모델 GNNWLR이 제안됩니다.

* GNNWLR은 광물 자원 예측 및 평가에서 다른 고급 모델보다 우수한 성능을 보입니다.

* GNNWLR은 공간적 이질성과 비선형 효과를 극복합니다.

* GNNWLR은 광물화 메커니즘에 대한 인공 지능의 해석성을 향상시킵니다.

서류 주소:
https://doi.org/10.1016/j.jag.2024.103746
공식 계정을 팔로우하고 "광석 형성 예측"에 답글을 남겨 전체 PDF를 받으세요.

글로벌 MPM 테스트 사이트 경쟁: 캐나다 노바스코샤주 메구마

이 연구는 캐나다 노바스코샤주 서부에 위치한 약 7,800㎢ 면적의 메구마 그룹에 초점을 맞췄습니다. 이 지역은 주로 초원과 숲으로 덮여 있습니다. 메구마 지대는 두 개의 지층으로 이루어져 있는데, 아래쪽 지층은 주로 변성사암으로 구성된 골든빌 군층입니다. 윗층은 셰일 복합 암석으로 구성된 핼리팩스 그룹층입니다.

아카디아 조산운동과 데본기 화강암의 배치로 인해 이 지역에는 북동-남서 방향으로 습곡 구조가 형성되었으며, 이는 다양한 광물 자원 예측 및 평가 시스템에 대한 시험장이 되었습니다.

단순화된 지질도 및 피처 레이어

연구 지역에는 탁한 금 광상 20개가 있습니다. 그러므로,이 연구에서는 앤티클라인 구조적 요인, 골든빌과 핼리팩스 형성 사이의 접촉 요인, 구리(Cu), 납(Pb), 비소(As), 아연(Zn)과 같은 화학 원소를 포함한 6개의 특징적인 층을 사용했습니다.

이 연구에서는 골든빌과 핼리팩스 층 사이의 앤티클라인과 접촉면에 대한 다중 링 완충 링을 분석하여 0.5km 간격으로 해당 가중치를 부여하여 총 16개의 완충 링을 형성했습니다. 동시에 이 연구에서는 화학 원소를 함유한 671개 호수 퇴적물 샘플에 대해 역거리 가중 보간(IDW)도 수행했습니다. 마지막으로, 연구에서는 전체 연구 지역을 격자화하고 모든 피처 레이어를 1km x 1km 격자 데이터로 통합했습니다.

20개의 양성 샘플은 전체 연구 지역에 비해 여전히 너무 작기 때문에 양성 샘플과 음성 샘플의 비율이 불균형할 가능성이 더 큽니다. 따라서 본 연구에서는 20개의 양성 샘플 지점을 중심으로 반경 2km를 나누어 완충 구역을 분석한 후 래스터 분석을 수행했습니다.

최종적으로, 연구 결과 245개의 양성 샘플이 발견되었는데, 이는 광물 침전물이 존재함을 나타내는 반면, 나머지는 광물 침전물이 존재하지 않음을 나타냅니다. 동시에, 연구에서는 음성 샘플 세트에서 양성 샘플과 동일한 양의 데이터를 무작위로 선택하여 양성 샘플과 병합하여 훈련 세트와 검증 세트를 만들었습니다.

GNNWR 모델: 신경망의 효율적 앙상블

지리 신경망 가중 회귀(GNNWR)의 모델 구조는 평균 제곱 오차를 사용하므로, 이를 광물 자원 예측 및 평가에 직접 적용하면 수렴에 어려움이 있을 수 있습니다. 연구 결과, 교차 엔트로피가 평균 제곱 오차보다 더 많은 실용적인 이점을 가지고 있는 것으로 나타났습니다. 그러므로,이 연구에서는 로지스틱 회귀를 위해 특별히 설계된 손실 함수인 이진 교차 엔트로피(BCE)를 사용했습니다.

이러한 맥락에서 GNNWLR은 먼저 각 데이터 포인트의 공간 좌표와 훈련 데이터 세트의 다른 데이터 포인트의 공간 좌표 사이의 거리를 계산하고, 이를 입력으로 사용하여 드롭아웃 정규화를 수행하고 과적합을 방지합니다.

둘째, 본 연구에서는 신경망이 출력한 공간적 가중치 벡터와 최소제곱법으로 얻은 계수, 독립변수의 값에 대해 내적 연산을 수행한 후, 로지스틱 회귀 함수를 적용하여 최종 예측값을 생성하였다.

마지막으로, 이 연구에서는 이진 교차 엔트로피 손실 함수를 사용하여 실제 값에 대한 손실을 계산하고 이를 통해 신경망이 부정적인 피드백 조정을 수행하도록 안내했습니다.

GNNWLR 모델 구축

이 연구에서 연구진은 또한 가장 흔한 지리적 가중 회귀(GWR), 지원 벡터 머신(SVM), 랜덤 포레스트(RF), 지리적 가중 로지스틱 회귀(GWLR), 지리적 가중 지원 벡터 회귀(GWSVR), 랜덤 포레스트(GWRF) 모델을 비교했습니다.

구체적으로, 이 연구에서는 5중 교차 검증을 사용하여 20개의 퇴적물을 각각 4개의 퇴적물로 구성된 5개의 시퀀스로 무작위로 나눈 다음, 버퍼 반경 2km에서 이 4개의 퇴적물에 대한 버퍼 분석을 수행하여 각 시퀀스에 대한 양성 샘플을 얻었습니다. 마찬가지로 이 연구에서도 양성 샘플의 개수와 맞춰 음성 샘플 풀에서 음성 샘플을 무작위로 선택했으며, 각 음성 샘플은 5겹 교차 검증에서 한 번씩만 나타났습니다.

5중 교차 검증 이론에 따르면, 4개의 샘플 세트는 학습에 사용되고 1개의 샘플 세트는 검증에 사용됩니다. 이 과정은 5번 반복되며, 각 시퀀스는 검증 세트 역할을 합니다. 마지막으로, 5겹 교차 검증을 통해 얻은 훈련 세트와 검증 세트를 병합합니다.

결과로부터,GNNWLR 모델에서 신경망을 효과적으로 통합했기 때문에 GNNWLR은 다른 모델보다 상당히 우수한 성능을 보이며 광물 분류에서 뛰어난 적합 및 예측 능력을 보여줍니다. AUC는 0.913으로 다른 모델보다 5%~16% 더 높습니다.한편, GWRF와 GWSVR은 RF와 SVM보다 상당히 우수한데, 이는 두 방법이 모두 지리적 가중 회귀(GWR)와 결합되어 공간 변수 간의 지역적 관계를 보다 정확하게 설명할 수 있기 때문일 수 있습니다.

각 모델의 성능 비교, GNNWLR이 가장 좋은 성능을 보임

모든 모델의 MPM 지도는 또한 노바스코샤에서 광물 탐사 가능성에 상당한 공간적 차이가 있음을 시각적으로 보여줍니다. 특히 북동부 지역이 전반적으로 점수가 더 높았는데, 이는 매장지의 실제 위치와 일치합니다. 하지만,GNNWLR은 집중된 지역에서 멀리 떨어진 금 자원을 보유하고 있기 때문에 다른 모델에서는 쉽게 간과할 수 있는 더 많은 매장지를 발견할 수 있습니다.

예를 들어, "지역 1"의 GNNWLR 점수는 0.985로 높은 반면, GWSVR, GWRF, GWLR, SVM, RF 및 GWR 모델의 해당 점수는 0.288, 0.438, 0.471, 0.133, 0.383 및 0.290에 불과합니다.

금 매장량의 예상 목표 지역을 얻기 위한 다양한 모델

또한 RF 및 SVM 모델은 "지역 2"와 "지역 3"에서 갑작스러운 점프를 보이며, 이는 정확도와 신뢰도에 영향을 미칩니다. GNNWLR, GWLR 및 GWR 모델은 광물화 요소의 공간적 근접성과 이질성을 고려하여 기존 머신 러닝 모델에서 흔히 발생하는 돌연변이 발생을 방지할 수 있습니다. GNNWLR은 이러한 요소들 사이의 복잡한 비선형 관계, 특히 공간적 변화와 관련된 관계를 포착하는 데 뛰어난 능력을 보이는 것으로 관찰되었습니다.

그러므로,GNNWLR은 광물 탐사 가능성을 예측하는 데 있어 비교적 원활한 전환을 보여주며, 경험적 데이터와 더 높은 정확도와 일관성을 보여줍니다.

SHAP은 광물화에 영향을 미치는 요인을 정량적으로 분석할 수 있습니다.

모델 평가의 해석성을 개선하기 위해 본 연구에서는 전체 데이터 세트의 양의 샘플 세트를 통합하여 사용하여 GNNWLR의 관련 위치에 대한 광물 전망 특성을 계산했습니다.

결과는 As가 모델 출력에 가장 큰 영향을 미치고 SHAP 값과 양의 상관관계가 있음을 보여줍니다. As 값이 클수록 SHAP 값이 높아지고 광화 가능성이 커집니다. 이는 As가 저온 열수 원소이고 종종 금 매장지와 관련이 있기 때문일 수 있습니다. 마찬가지로 Zn은 많은 광산 지역에 부정적인 영향을 미쳤지만, Cu는 영향이 가장 적었습니다. 그 중 As와 Pb는 웅장석, 방연석 등의 광물과 관련된 저온 열수 원소이고, Zn과 Cu는 섬아연석, 황동석 등의 광물을 형성하는 중온 열수 원소입니다.요약하자면, 이 지역의 금 매장지 형성은 저온 열수 작용과 밀접한 관련이 있습니다.

6개 피처 레이어에 대한 SHAP 값

이 연구는 다양한 지역에서 다양한 특성을 지닌 광화작용의 영향을 평가함으로써 "지역 4"의 광화작용이 앤티클라인과 납과 강한 상관관계를 가지고 있으며, "지역 5"에는 두 개의 광물 매장지가 있다는 것을 발견했습니다. 북쪽 광상은 Cu, Pb, Zn, As의 4가지 원소에 의해 긍정적인 영향을 받는데, 이는 저지대가 중온 열수광화와 저온 열수광화 모두를 가지고 있음을 나타냅니다. 남쪽 광상은 Zn과 As에 의해 긍정적인 영향을 받는데, 이는 중온의 열수 유체가 주요 물질임을 나타냅니다.

노바스코샤 자연자원부의 시추 데이터와 결합하면 "5지역" 북부 매장지의 금광과 관련된 39건의 지질 시추 기록이 있는데, 여기에는 다양한 저온 및 중온 열수 광물이 포함됩니다. "5구역"의 남쪽 광상에 있는 금광과 관련된 지질학적 시추 기록은 단 4개뿐입니다. 이 매장 지역은 주로 황화물과 황비소철석과 같은 중온 열수성 광물을 함유하고 있습니다. 6구역의 광화작용은 앤티클라인 접촉과 밀접한 관련이 있으며, 이는 SHAP 값의 공간 분포에 기초한 광화작용 유형에 대한 추론을 확인시켜 줍니다.

5 두 매장지의 시추 데이터에서 금과 함께 나타나는 다른 광물의 빈도

요약하자면, SHAP 값에 기반한 모델은 광화작용 결과에 영향을 미치는 다양한 요인을 전체 공간 영역에서 정량적으로 분석할 수 있으며, 해석성이 뛰어나고 지구 과학의 원리와 일치합니다.동시에 본 연구에서는 SHAP 값과 회귀계수의 공간분포도도 비교하였다. 결과는 회귀 계수의 공간적 분포가 지질학적 법칙과 완전히 일치하지 않는다는 것을 보여줍니다. 따라서 SHAP 값은 학자들이 전통적인 회귀 계수보다 더 의미 있고 참조하기 쉽습니다.

GNNWLR 모델의 6개 피처 레이어의 회귀 계수의 공간 분포

저장대학교 두진홍 교수, 시공간 빅데이터와 인공지능 연구에 집중

저장대학교 지구과학대학 두진훙 교수가 이끄는 연구팀은 원격탐사 및 지리정보시스템, 시공간 빅데이터 및 인공지능 분야의 과학연구에 오랫동안 참여해 왔으며, 지리학, 해양학, 지질재해 등 분야에서 시공간 빅데이터 분석의 기초이론 및 핵심기술 연구에서 일련의 성과를 거두었습니다. 그는 팀을 이끌고 GIS, 원격탐사, 컴퓨터과학을 지리학, 해양학, 지질학 등에 완전히 통합하여 데이터 기반 지구과학 발전의 새로운 장을 개척하고 있습니다.

참고문헌:
1.https://www.zast.org.cn/art/2022/12/8/art_1675105_58963288.html