AI "부패 방지", 독일 막스 플랑크 연구소, NLP와 DNN 결합해 내식성 합금 개발

내용을 한눈에 보기:스테인리스 스틸로 둘러싸인 세상에서 우리는 부식의 존재를 거의 잊고 있을지도 모릅니다. 그러나 부식은 삶의 모든 측면에서 존재합니다. 녹슨 못이든, 오래되어 누수된 전선이든, 광택을 잃은 자동차이든, 이 모든 것은 부식으로 인해 발생합니다. 통계에 따르면, 전 세계적으로 금속 부식으로 인한 경제적 손실은 매년 2조 5천억 달러를 넘어섰으며, 이는 다른 자연재해보다 훨씬 높습니다. 이 중 중국에서 부식으로 인한 경제적 손실은 약 3,949억 달러로, 중국 GDP의 4.2%에 해당합니다. 이러한 이유로 연구자들은 더 나은 내식성을 갖춘 합금이나 금속 보호 필름을 연구해 왔습니다. 오늘날 AI는 재료의 내식성을 최적화하는 데 활용되고 있습니다.
키워드:자연어 처리 딥 뉴럴 네트워크 부식
저자 | 쉐차이
편집자 | 산양
본 기사는 HyperAI WeChat 공개 플랫폼에 처음 게재되었습니다.~
미국부식엔지니어협회(NACE)의 통계에 따르면, 2013년 전 세계적으로 부식으로 인한 경제적 손실이 2조 5,000억 달러를 넘었습니다.동시에 중국도 부식으로 어려움을 겪었으며, 그해 약 3,949억 달러의 경제적 손실을 입었고, 이는 GDP의 4.21%에 해당했습니다. 이는 다른 선진국보다 약간 높은 수치입니다.
비교해 보면, 2008년 원촨 지진으로 인한 경제적 손실은 약 1,100억 달러에 달했습니다.즉, 2013년만 해도 우리나라에서 부식으로 인한 경제적 손실만 해도 원촨 지진 3건을 넘어섰습니다.

표 1: 2013년 전 세계 부식으로 인한 경제적 손실(단위: 10억 미국 달러)
부식 문제를 해결하기 위해 연구자들은 재료의 강도를 높이는 동시에 부식 저항성을 개선하는 방법을 모색하기 위해 노력하고 있습니다.. AI의 도움으로 고온에서 합금의 부식 메커니즘을 예측하고, 강철의 대기 부식 속도와 철근 콘크리트의 환경 부식을 분석하고, 합성곱 신경망(CNN)을 사용하여 이미지에서 재료의 부식 형태를 판별하는 등 어느 정도 진전을 이루었습니다.
하지만 머신러닝 모델의 입력 데이터는 대부분 수치형 데이터입니다. 하지만 금속소재의 가공 및 분석에는 pH값, 시험온도 등의 수치적 데이터 외에도 소재의 종류 등의 범주형 데이터와 열처리 공정, 시험방법 등의 텍스트형 데이터도 존재합니다.기존의 머신 러닝 모델은 모든 데이터를 철저히 읽고 분석할 수 없으며, 예측 정확도도 낮습니다.
이를 위해 독일의 막스 플랑크 철 연구소(MPIE, Max-Planck-Institut für Eisenforschung)가 프로세스 인식 DNN은 심층 신경망(DNN)과 자연어 처리(NLP)를 결합하여 개발되었습니다.이 모델은 수치형 데이터와 텍스트 데이터를 결합하여 처리할 수 있으며, 정확도는 다른 모델보다 15% 더 높습니다.
동시에 그들은 금속의 물리적, 화학적 특성을 기술자로 변환하고 특징 변환 DNN을 구축했습니다.이는 훈련 세트에 존재하지 않는 원소가 부식 저항성에 미치는 영향을 예측하는 데 사용할 수 있습니다. 이 연구는 2023년 8월 Science Advances에 "자연어 처리와 딥러닝을 통한 내식성 합금 설계 향상"이라는 제목으로 게재되었습니다.

관련 연구는 Science Advances에 게재되었습니다.
논문 링크:
https://www.science.org/doi/10.1126/sciadv.adg7992
프로세스 인식 DNN
모델 디자인
본 연구의 데이터 세트는 수치 데이터, 분류 데이터, 텍스트 데이터를 포함한 5가지 범주로 구성된 769개 합금의 공식화 가능성입니다. 이 중 수치형 데이터는 모델에 직접 입력되고, 범주형 데이터는 순차적으로 번호를 매겨 수치형 데이터로 변환하여 모델에 입력됩니다.텍스트 데이터는 NLP 아키텍처를 통해 처리된 후 모델에 입력됩니다.
NLP 아키텍처는 주로 어휘 태그 지정, 벡터화, 벡터 시퀀스 처리 등 세 부분으로 나뉩니다.
단어 태깅 중에 각 단어는 특정 정수 토큰으로 대체됩니다.어휘 태그를 통해 문구나 문장이 정수 벡터로 변환됩니다.
어휘 태그를 적용한 후, 텍스트 데이터를 수치 값으로 변환하더라도 수치 값 사이에는 상관 관계가 없으며 원래 텍스트의 의미를 전달할 수 없습니다. 따라서 정수 벡터는 벡터화를 통해 n차원 부동 소수점 벡터로 변환됩니다. 학습 과정 동안 각 단어의 가중치는 지속적으로 최적화됩니다.훈련 후, 벡터 간의 근접성은 의미적 유사성과 일치합니다.
마지막으로, n차원 부동 소수점 벡터는 장단기 메모리 순환 신경망(LSTM)을 통해 단일 벡터로 변환되어 입력층으로 들어갑니다. LSTM은 게이트 함수를 통해 단어 간의 장기 종속성을 식별할 수 있습니다.따라서 LSTM은 주어진 문장에서 핵심적인 관련 단어를 찾아 문장의 가장 중요한 부분을 DNN의 입력 계층으로 전달할 수 있습니다.

그림 1:프로세스 인식 DNN 모델 구조
A: NLP 데이터 처리 워크플로
B: 프로세스 인식 DNN 모델의 개략도
훈련 및 검증
연구자들은 훈련 후 모델의 절대 평균 오차를 요약했습니다. 프로세스 인식 DNN의 평균 절대 오차는 약 150mV로, 간단한 DNN보다 20mV 낮습니다. 예측된 피팅 잠재력과 실제 피팅 잠재력 사이의 R2 이는 0.78 ± 0.06으로, 더 간단한 DNN의 0.61 ± 0.04보다 높습니다.위의 결과는 텍스트 데이터를 분석한 후 프로세스 인식 DNN의 성능이 단순한 DNN 모델보다 우수함을 보여줍니다.

그림 2: 프로세스 인식 DNN 훈련 결과
A: 훈련 및 검증 중의 평균 절대 오차, 여기서 빨간색 선은 간단한 DNN 모델의 평균 절대 오차입니다.
B: 프로세스 인식 DNN과 간단한 DNN 모델 간의 결과 비교.
합금 조성 최적화
합금 조성 최적화 과정에서 프로세스 인식 DNN과 단순 DNN의 차이점을 비교하기 위해 연구진은 유사한 합금 조성에서 시작하여 동일한 학습률을 사용하고 두 모델을 모두 사용하여 합금 조성을 최적화했습니다.

그림 3: 구성 요소 최적화 결과
A&B: 철 기반 합금의 최적화 결과
C&D: Ni-Cr-Mo 합금 최적화 결과;
E&F: Al-Cr 합금 최적화 결과;
G&H: 고수분 합금에 대한 최적화 결과.
그림에서 볼 수 있듯이 철 기반 합금과 FeCrNiCo 고수분 합금에 대한 두 모델의 최적화 결과는 부분적으로 유사하지만, 다른 두 합금에 대한 최적화 결과는 매우 다릅니다.첫째, 공정 인식 DNN은 Mo 원소 함량이 증가하면 Fe 기반 합금과 Ni-Cr-Mo 합금의 공식 발생 가능성이 크게 증가할 것으로 예측합니다. 둘째, 공정 인식 DNN은 Ni-Cr-Mo 합금에서 간극 질소와 간극 탄소가 합금의 피팅 가능성을 높일 수 있다고 믿습니다. 마지막으로 Al-Cr 합금에서 Cu 원소는 또한 피팅 가능성 향상에 기여합니다. 이러한 것들은 모두 간단한 DNN에서는 무시됩니다.
특징 변환 DNN
모델 디자인
합금 조성 특성화 기능인 "WenAlloys"를 통해 합금 조성 정보를 일련의 원자적, 물리적, 화학적 특성으로 분해하고, 이를 DNN 모델의 입력 값으로 다양한 설명자로 변환할 수 있습니다.

표 2: 일부 기능의 변환 결과
여기서 c나 , r나 , 엑스나 그리고 E씨, 나 이들은 각각 원자 분율, 원자 반경, 파울리 전기 음성도, 원소 결합 에너지를 나타냅니다.
훈련 및 검증

그림 4: 특징 변환 DNN의 학습 결과
A: 모델 학습 및 검증 중의 오차 곡선입니다.
B: 예측된 피팅 잠재력과 훈련 후 실제 피팅 잠재력의 회귀 곡선.
C: 특징 변환 DNN과 단순 DNN의 결과 비교.
학습 후, 특징 변환 DNN의 평균 절대 오차는 약 168mV, R입니다.2 0.66으로, 단순한 DNN 모델에 비해 성능이 약간 향상되었습니다.
특징 변환 DNN을 이용한 부식 방지 메커니즘 분석
5가지 범주에서 각각 하나의 합금을 선택하여 특성 변환을 거친 후 최적화를 위해 모델에 입력했습니다. 최적화 곡선을 기준으로 입력 특징은 두 가지 범주로 나눌 수 있습니다.한 유형의 기능 곡선은 학습 세트에서 예상했던 것보다 최적화 과정에서 상당히 변경됩니다. 다른 유형의 기능 곡선은 최적화 과정에서 약간만 변경됩니다.

그림 5: 다양한 입력 기능에 대한 최적화 곡선
그림은 최적화 과정에서 크게 바뀐 네 가지 특징을 보여주는데, 이는 이러한 특징이 합금의 피팅 가능성을 개선하는 데 중요한 매개변수가 될 수 있음을 의미합니다.
특징 변환 DNN을 이용한 Al-Cu-Sc-Zr 합금 예측
DNN의 특징 변환 입력에는 구성 요소의 원자적, 물리적, 화학적 특징만 포함되어 있으므로,따라서 훈련 세트에 존재하지 않는 요소에 대한 예측을 할 수 있습니다.
다양한 합금에서 Sc와 Zr 원소는 내식성이 향상된 것으로 나타났습니다. 따라서 연구팀은 특징 변환 DNN을 사용하여 이 두 원소가 Al-Cu 합금에 미치는 영향을 분석했습니다.

그림 6: Al-Cu-Sc-Zr 합금의 피팅 가능성에 대한 특징 변환 DNN 예측 결과
그림에서 보듯이 Zr과 Sc 원소 함량이 증가함에 따라 합금의 공식 발생 가능성은 계속 증가하여 합금의 내식성이 향상되었음을 나타냅니다.이 결과는 새로운 요소에 대한 특징 변환 DNN의 예측 능력을 검증합니다.
위의 결과는 다음을 보여줍니다.NLP와 DNN을 결합하면 모델은 합금 처리 및 테스트 방법에 대한 텍스트 데이터를 읽을 수 있습니다.따라서 이 모델은 기존 DNN 모델보다 성능이 뛰어나며, 간단한 DNN에서 무시한 원소가 합금의 내식성에 미치는 영향을 발견할 수 있습니다.특징 변환 DNN은 합금의 원자적, 물리적, 화학적 특성을 기반으로 훈련 세트에 존재하지 않는 원소의 성능을 예측할 수 있습니다.
부식: 금속의 조용한 살인자
2009년 세계부식기구(WCO)는 부식에 대한 대중의 인식을 높이기 위해 매년 4월 24일을 세계 부식의 날로 지정했습니다. 부식은 흔한 화학 현상으로 우리 삶의 모든 곳에 존재합니다. 다양한 주방용품, 가전제품, 바다, 육지, 공중을 이용한 운송수단, 심지어 독특하게 디자인된 건물까지도 모두 부식으로 어려움을 겪습니다.금속이 있는 곳에는 부식이 있다고 할 수 있다.
금속 부식에는 화학적 부식과 전기화학적 부식이 있는데, 이 중 전기화학적 부식이 더 흔하고 더 해롭습니다. 전기화학적 부식은 두 금속이 전해질 용액에서 회로를 형성하여 전기화학 전지를 형성하고, 이로 인해 활성 금속이 부식되는 현상을 말합니다. 일반적인 전기화학적 부식에는 균일 부식, 점식 부식, 응력 부식, 틈새 부식 등이 있습니다.그 중에서도 불균일 부식, 특히 점식 부식과 기타 감지하기 어려운 형태의 부식은 금속에 더 해로우며 사고를 쉽게 일으킬 수 있습니다.

그림 7: 일반적인 전기화학적 부식 유형
2013년 11월 22일, 산둥성 칭다오시의 석유 파이프라인은 염소 농도가 높고 건조하고 습한 환경이 장시간 번갈아 가며 노출되어 파이프라인 벽이 부식되고 얇아지다가 결국 파열되어 원유가 누출되었습니다. 이후 정화 및 수리 과정에서 부적절한 현장 작업으로 인해 원유 폭발이 발생하여 결국 62명이 사망하고 163명이 부상당했습니다.
부식은 감지하기 어려운 경우가 많기 때문에 부식 사고를 방지하려면 정기적인 수동 검사 및 수리가 필요하며, 여기에는 많은 인력과 물적 자원이 소모됩니다.이제 AI의 도움으로 합금의 구성을 최적화하고 내식성이 더 뛰어난 소재를 찾을 수 있습니다.동시에, 디지털 부식 모니터링 시스템도 사용되어 부식 가능성을 신속하게 찾아내는 데 도움이 되고 있으며, "침묵의 살인자"가 더 이상 조용하지 않습니다.
참조 링크:
[1] http://impact.nace.org/documents/Nace-International-Report.pdf
[2] https://whatispiping.com/corrosion/?expand_article=1
[3] https://www.gov.cn/govweb/jrzg/2014-01/11/content_2564654.htm#:
본 기사는 HyperAI WeChat 공개 플랫폼에 처음 게재되었습니다.~