화중과학기술대학교의 Li Song 연구 그룹은 머신 러닝을 사용하여 다공성 재료의 수분 흡착 등온선을 예측했습니다.

다공성 물질의 수분 흡착 등온선은 매우 중요한 매개변수이지만, 쉽게 얻을 수 있는 것은 아닙니다. 다공성 물질의 종류가 너무 많고 구조도 다양하기 때문에 실험과 계산을 통해 수분흡착 등온선 데이터를 얻는 데는 비용과 시간이 너무 많이 소요되기 때문입니다.
화중과학기술대학의 리 송 연구 그룹은 AI를 훈련시켜 재료의 구조적 매개변수에 따라 수분 흡착 등온 매개변수와 그에 따른 응용 성능을 예측하는 2단계 머신 러닝 모델을 구축했습니다.
저자 | 지아링
편집자: Xuecai, Li Hui, Sanyang
다공성 재료는 물 정화, 담수화, 물 수확, 흡착 열 변환 등에 엄청난 응용 분야가 있습니다. 이러한 흡착 기반 응용 분야에서는 표면 친수성, 탈착 히스테리시스, 물 흡수와 같은 구조적 특성이 다공성 재료의 성능에 영향을 미칠 수 있습니다. 이러한 구조적 특성은 물 흡착 등온선으로부터 얻을 수 있습니다.
그렇다면 물질의 수분흡착 등온식을 얻는 방법은 무엇일까요?
여러 흡착제의 수분 흡착 등온선을 실험적으로 얻는 것은 어렵지 않지만, 다공성 물질의 종류는 다양합니다. 예를 들어, 케임브리지 구조 데이터베이스는 10만 개가 넘는 다공성 재료에 대한 데이터를 기록하고 있습니다. 물론 하나하나씩 종합해서 시험해보는 것은 무리가 있습니다.
만약 물흡착 등온식을 계산적 수단으로 얻는다면, 흡착제 결정 구조의 분자 시뮬레이션을 수행할 수 있지만, 계산 비용이 매우 높고 대규모로 예측하기 어렵다.
머신 러닝은 방대한 양의 데이터를 요약하고 처리하여 패턴을 추출할 수 있으며, 재료 특성 예측에 특정 응용 사례가 있습니다.이를 바탕으로 화중과학기술대학 리송 연구진은 기계학습 모델을 구축하고, AI를 훈련시켜 다공성 물질의 구조적 매개변수를 추출하여 수분 흡착 등온선을 예측했으며, 이를 바탕으로 다양한 흡착제의 냉각 성능과 이후 응용 분야를 더욱 예측했습니다.

연구 결과는 저널 "Journal of Materials Chemistry A"에 게재되었습니다.
논문 링크:
https://pubs.rsc.org/en/content/articlelanding/2023/TA/D3TA03586G
01 실험 절차
데이터세트:EWAID 데이터베이스
연구진은 EWAID 버전 3.0 수분 흡착 등온선 데이터베이스에서 460개의 나노다공성 흡착제를 선택했습니다.정의된 결정 구조를 갖는 금속 유기 골격(MOF), 공유 결합 유기 골격(COF) 및 제올라이트를 포함하여, 문헌 연구를 통해 물 흡착 등온선 데이터를 얻었습니다.
EWAID:실험 수분흡착 등온선 데이터베이스
선정된 460개의 흡착제 중 148개가 모든 구조적 특징을 가지고 있었으며, 관련 구조적 매개변수는 접근 가능한 표면적(Sa), 유효 기공 부피(Va) 및 기공 직경(Dp)이었습니다.
148개 흡착제의 수분 흡착 등온선을 맞추기 위해 범용 흡착 등온선 모델(UAIM)을 사용하였고, 다양한 압력(P)에서 298K에서 물질의 수분 흡수율(W)을 얻었습니다.
흡착제의 구조적 특성과 흡착 성능 데이터(Sa, Va, Dp, P 및 W)를 머신 러닝 모델에 입력하여 학습시켰습니다.

EWAID에서 선택한 흡착제
모델 아키텍처:2단계 ML 전략
연구원들은 2단계 ML 전략을 개발했습니다.
다공성 물질의 구조적 매개변수(Sa, Va, Dp)와 흡착압력 P는 데이터베이스에서 매개변수로 추출하여 ML:SI 모델에 입력하였고, 머신러닝을 이용하여 수분흡착 등온식을 예측하였다.
수분흡착 등온식을 추정한 후, 포화흡착용량(W)과앉았다), 등온선의 단계 위치(α)와 헨리 상수(K시간) 그리고 ML:IP 모델을 입력합니다. 흡착식 냉동 시스템의 성능 계수(COP)를 계산합니다.기음, 냉각 성능 계수)와 흡착제/물 작동 유체 쌍의 특정 냉각 효과(SCE)를 사용하여 흡착 냉각 성능을 평가했습니다.

2단계 머신 러닝 전략의 개략도
알고리즘 학습:RF와 ANN의 종합적 적용
머신 러닝 모델을 개발하는 데는 Scikit-learn 모듈이 사용되었고, 2단계 머신 러닝 학습 훈련에는 RF(랜덤 포레스트)와 ANN 알고리즘이 사용되었습니다.
데이터 세트 TP3T의 801개 샘플을 무작위로 선택하여 학습 세트로 사용하고, 나머지 201개 TP3T 샘플을 테스트 세트로 사용합니다.
학습 과정에서 알고리즘의 최적 하이퍼 매개변수를 결정하기 위해 5겹 교차 검증 방법을 사용하여 서로 다른 하이퍼 매개변수 그룹으로 구축된 모델을 테스트했습니다.2 최적의 하이퍼파라미터를 결정합니다.
02 구조에서 등온선까지: SI 프로세스
성능 검증:데이터베이스 내 등온선 예측
RF는 ANN보다 더 정확합니다
148개의 훈련 흡착제의 구조적 특성과 흡착 성능 데이터(Sa, Va, Dp, P 및 W)를 기반으로 ML 모델을 사용하여 물 흡착 등온선을 예측했습니다.아래 표에서 볼 수 있듯이 RF 모델은 수분 흡착 등온식을 예측하는 데 높은 정확도를 가지고 있습니다.

RF 및 ANN 예측 정확도
아래 그림 a에서 볼 수 있듯이, 이들 흡착제의 수분 흡수율은 0~2.0g/g 사이에 분포하며, 대부분은 0~0.8g/g 사이에 있습니다.
아래 그림 b의 상대적 중요도 분석에서 흡착 압력(P)이 물 흡수에 가장 큰 영향을 미치고, 둘은 양의 상관관계를 가지고 있음을 알 수 있습니다. 고정된 압력에서 흡착제의 구조적 특성, 특히 표면적과 기공 부피는 얼마나 많은 물을 흡수할 수 있는지를 결정합니다.

물 흡수에 대한 RF 모델 예측
RF 모델은 더 높은 정확도로 예측합니다.
데이터베이스에서 서로 다른 구조적 특성을 가진 몇 가지 대표적인 흡착제를 실험 대상으로 사용하였고, EWAID 실험 데이터와 RF 모델이 예측한 수분 흡착 등온선을 비교하였다.
데이터베이스에는 네 가지 주요 유형의 수분 흡착 등온선이 있습니다. 유형 I(그림 a 및 c에 표시된 역 L자 모양), 유형 V(그림 d 및 f에 표시된 일반적인 S자 모양), 유형 IV 및 유형 VI(그림 g 및 i에 표시된 두 개 이상의 흡착 단계가 있는 모양)입니다.
아래 그림에서 볼 수 있듯이,등온선의 종류와 흡착재의 구조적 특성에 관계없이 흡착 등온선의 예측값은 실험값과 높은 일치성을 보이며, 이는 RF 모델의 높은 정확도를 입증합니다.

수분 흡착 등온선 예측 결과: 회색은 EWAID 실험 데이터를 나타내고, 파란색은 RF 모델 예측 데이터를 나타냅니다.
RF는 더 높은 감도로 작은 구조적 차이점을 식별할 수 있습니다.
금속(MOF-74-M 및 CUK-1-M, M = Co, Mg, Ni) 및 작용기(MIL-101-Cr + X, X = NH2, 그래서3H, 아니오2) 구조적 차이로 인해 발생하는 수분 흡착 등온선의 변화를 연구합니다.
수정 후의 구조적 매개변수는 다음 표와 같습니다.

흡착제의 구조적 특성
해당 수온 등온선 예측 결과는 아래 그림과 같습니다.

물 등온선 예측 결과 다이아몬드는 EWAID 실험 데이터를 나타내고 점은 RF 예측 결과를 나타냅니다.
미세한 구조적 차이가 있는 흡착제의 경우, RF 모델은 물 흡착 등온선의 차이를 정확하게 예측하여 높은 정확도와 민감도를 보였습니다.
성능 확장:데이터베이스 외부 등온선 예측
연구진은 RF 모델의 적응성을 더욱 검증하기 위해 EWAID 데이터베이스에 포함되지 않은 흡착제(ZJU-210-Al, NU-405-Zr 및 iso-NU-1000-Zr)를 선택하여 테스트했습니다. 결과는 아래 그림과 같습니다.

물 등온선 예측 결과 회색은 실험 데이터를 나타내고 파란색은 RF 모델 예측 데이터를 나타냅니다.
그림 a 및 b에서 볼 수 있듯이 RF 모델은 ZJU-210-Al 및 NU-405-Zr의 수분 흡착 등온선을 잘 예측합니다. 그림 c에서 RF 모델은 ISO-NU-1000-Zr의 고압 수분 흡수율이 실험값보다 낮을 것으로 예측합니다.
이러한 예측 편차는 EWAID 데이터베이스에 높은 흡착 샘플(수분 흡수량 > 0.8 g/g)의 수가 충분하지 않거나 ISO-NU-1000-Zr의 구조적 설명이 부족하기 때문에 발생할 수 있습니다.
미세한 구조적 차이가 있는 흡착제에 대한 연구 결과는 아래와 같습니다.

물 등온선 예측 결과 다이아몬드는 EWAID 실험 데이터를 나타내고 점은 RF 예측 결과를 나타냅니다.
UiO-66-Zr과 비교했을 때, UiO-67-Zr의 리간드의 추가 벤젠 고리는 소수성입니다. 그림 d에서 UiO-67-Zr의 물 흡착 등온선은 고압 방향으로 이동합니다.
MOF-303-Al은 CAU-23-Al보다 친수성이 더 높습니다. 그림 e에서 MOF-303-Al은 더 작은 계단 위치를 보여주고, 물 흡착 등온선은 저압 방향으로 이동합니다.
표면 친수성에 따르면 UiO-66-Zr + (OH)2 > UiO-66-Zr + NH2 > UiO-66-Zr + CH3 RF 모델 예측은 그림 f에서 UiO-66-Zr + NH 순서로 수행됩니다.2 그리고 UiO-66-Zr + CH3 등온선 단계 위치의 예측 값은 실험 값보다 크고 고압 방향으로 이동합니다. 이는 RF 모델이 소수성을 과대평가한다는 것을 나타냅니다.
이러한 편차는 RF 모델에서 흡착제 표면 특성에 대한 설명자가 동일한 계열에 속하지만 표면 친수성이 다른 흡착제를 효과적으로 구별할 만큼 풍부하지 않다는 사실에 기인할 수 있습니다.
요약하자면, RF 모델은 데이터베이스 외부의 다공성 물질의 수분 흡착 등온선에 대한 높은 예측 정확도를 가지고 있으며, 어느 정도 물질의 구조적 차이점을 구분할 수 있습니다. 그러나 데이터베이스의 자료 예측과 비교하면 약간의 차이가 있을 수 있습니다. 이러한 편차는 훈련 데이터를 보완하고, 구조적 특징 설명자를 풍부하게 하는 등의 방법으로 수정할 수 있습니다.
03 등온선에서 성능까지: IP 프로세스
매개변수 추출:순경기음 그리고 SCE
ML 모델이 예측한 수분 흡착 등온선을 기반으로 포화 흡착 용량(W)의 세 가지 설명자가 추출되었습니다.앉았다), 등온선의 단계 위치(α)와 헨리 상수(K시간), 흡착식 냉각기(AC)의 성능을 분석합니다.

흡착 등온 특성의 개략도
흡착냉각 성능은 성능계수(COP)를 기준으로 측정할 수 있다.기음냉각 성능 계수와 흡착제/물 작동 쌍의 특정 냉각 효과(SCE)는 성능을 평가하는 데 사용됩니다.
설명자(W)를 사용하여앉았다,α,K시간), ML 모델은 COP를 빠르게 얻을 수 있습니다.기음 복잡한 계산 과정이 필요 없이 SCE를 사용할 수 있습니다.
성능 예측:등온 매개변수와 성능 간의 관계
460개의 흡착제/물 작동 유체 쌍(W)의 흡착 등온 특성에 따르면앉았다,α,K시간), ML 모델을 사용하여 SCE 및 COP 분석기음 예측을 해보세요.아래 표에서 볼 수 있듯이 RF 모델은 SCE와 COP를 예측하는 데 효과적입니다.기음 모든 면에서 높은 정밀도를 가지고 있습니다.

RF 및 ANN 예측 정확도
아래 그림 a 및 b에서 볼 수 있듯이 대부분의 작동 유체 쌍의 SCE 및 COP는 다음과 같습니다.기음 각각 0.400 kJ/kg 및 0.4-0.8 범위에 있습니다.
아래 그림 c와 d의 상대적 중요도 분석에서 우리는 W를 볼 수 있습니다.앉았다 SCE를 결정할 때 K시간 COP를 결정할 때기음 58%의 중요성,이는 W를 의미합니다앉았다 그리고 SCE, K시간 그리고 COP기음 사이에는 강한 상관관계가 있습니다.

SCE 및 RF의 예측값과 상관분석
아래 그림에서 우리는 다음을 볼 수 있습니다.3가지 매개변수가 Wsat = 0.2~0.8 g/g, α = 0.1~0.3, KH = 10-4 – 10-1 (mol/kg·Pa) 범위에 있을 때 냉각 성능을 (SCE > 200kJ kg-1, COP)로 유지할 수 있다.기음 > 0.7)이고, 수분흡착 등온선은 V자 모양입니다.

148개의 흡착제 중 W앉았다 , α, K시간 냉각 성능의 관계
04 소재 연구의 새로운 패러다임은 머신러닝과 분리될 수 없습니다.
재료 과학의 지도 이념은 네 가지 패러다임으로 요약될 수 있습니다.
- 경험적 시행착오법
- 물리학과 화학의 법칙
- 컴퓨터 시뮬레이션;
- 빅데이터를 기반으로 한 과학.
1990년대에 Rao et al. 세라믹 매트릭스 복합재료(CMC)를 연구할 때 시뮬레이션에 ANN을 사용했는데, 이는 재료 과학에서 머신 러닝을 선구적으로 적용한 사례입니다.
과학과 기술의 발달로, 네 번째 패러다임은 다른 세 가지 패러다임의 장점을 결합했습니다.머신 러닝은 재료 과학 분야에서 매우 인기가 많으며, 재료의 발견, 제조, 성능 분석 및 검증에 활용되고 있습니다.

재료 과학에서의 머신 러닝 응용
그러나 연구자들이 머신 러닝을 사용하여 재료의 실용적 응용 프로그램을 직접적으로 구현하기까지는 아직 갈 길이 멉니다.
머신러닝은 우리에게 "구조-성능" 관점을 제공합니다. 우리는 연구자들이 AI와 협력하여 구조와 성능을 진정으로 이해하고 혁신을 촉진하며 재료 과학의 새로운 미래를 함께 탐구하기를 기대합니다.
참고문헌:
[1]https://pubs.rsc.org/ko/content/articlelanding/2023/TA/D3TA03586G
[2]https://www.sciencedirect.com/science/article/abs/pii/S235249282201741X