다중 모드 모델은 새로운 소재와 산업 응용 분야의 매칭을 가속화하여 완전한 결정 구조가 필요 없이 소재의 특성을 예측합니다.

화이허 남쪽에서 자란 오렌지는 오렌지가 되고, 화이허 북쪽에서 자란 오렌지는 귤이 됩니다. 같은 씨앗을 다른 토양과 기후에 심어도 전혀 다른 열매를 맺습니다. 이러한 자연적 성장 법칙은 재료 화학에서도 마찬가지로 분명하게 드러납니다. 새로운 소재는 응용 분야에 따라 각기 다른 성능을 보입니다. 연구에 따르면 과학자들은 매년 수십만 개의 새로운 소재를 개발합니다. 이러한 소재는 엄청난 잠재력을 지닌 무수한 "씨앗"과 같으며, 잘 자라기 위해서는 적합한 환경에 뿌리를 내려야 합니다.
현재의 신소재 설계는 특정 응용 분야를 위해 합성되는 경우가 많지만, 다양한 분야에서 잠재적으로 활용될 수 있는 경우가 많습니다. 그러나 신소재의 적용 시나리오를 신속하게 파악하는 것은 여전히 어려운 과제입니다.널리 사용되는 결정질 재료인 금속-유기 골격체(MOF)를 예로 들어 보겠습니다. MOF의 가장 주목할 만한 응용 분야는 수소와 메탄과 같은 기체의 저장 매체로, 멤브레인, 박막 소자, 촉매, 그리고 생체 영상 분야에서 탁월한 성능을 보여줍니다. MOF의 최적 적용을 결정하는 전통적인 접근법은 중간 단계로서 재료의 특성에 의존하지만, 실험에는 시간, 장비, 그리고 전문 지식 측면에서 많은 비용이 듭니다. 더욱이, 컴퓨터 스크리닝과 머신 러닝 방법은 특성을 예측하기 위해 완전한 결정 구조가 필요하지만, 결정 구조 분석은 시간이 많이 소요되고 MOF 합성 후에는 쉽게 얻을 수 없습니다.
이 문제를 해결하기 위해 캐나다 토론토 대학교 화학공학 및 응용화학과의 연구팀은 다중 모드 머신 러닝 모델을 기반으로 한 새로운 방법을 제안했습니다.MOF 합성 후 사용 가능한 정보를 사용하여 잠재적인 특성과 용도를 예측합니다.예를 들어, 이 모델은 분말 X선 회절 패턴(PXRD)과 합성에 사용된 화학물질을 포함합니다. 연구팀은 MOF 합성 직후 응용 분야를 제안하는 응용 분야 추천 시스템을 모델에 추가했습니다. 이 연구는 금속-유기 골격체(MOF) 합성과 그 응용 시나리오 간의 연관성을 가속화합니다.
관련 연구는 "다중 모드 머신 러닝을 사용하여 금속-유기 골격 합성을 응용 프로그램과 연결"이라는 제목으로 Nature Communications에 게재되었습니다.
연구 하이라이트:
* 이 방법은 MOF의 잠재적 특성과 용도를 예측하기 위해 합성 후에 얻을 수 있는 정보만을 사용하여 MOF가 합성된 직후에 적용 권장 사항을 제시함으로써 재료 합성에서 적용까지의 주기를 크게 단축합니다.
* 이 모델의 예측 성능은 정밀한 결정 구조 입력을 필요로 하는 고급 모델(예: CGCNN 및 MOFormer)과 유사하며, 특정 조건에서는 이를 능가하기도 합니다. 또한 실험 노이즈, 결정 구조 결함 및 기타 조건에서도 안정적이고 신뢰할 수 있어 탁월한 강건성을 보여줍니다.
* 본 연구는 시각적 애플리케이션 추천 시스템을 결합하여 합성-예측-애플리케이션 폐쇄 루프 시스템을 구축합니다.

서류 주소:
https://www.nature.com/articles/s41467-025-60796-0
공식 계정을 팔로우하고 "MOFs"라고 답글을 달면 전체 PDF를 받을 수 있습니다.
더 많은 AI 프런티어 논문: https://hyper.ai/papers
"데이터는 합성 사이트입니다": 응용 예측을 위한 MOF 데이터 구축 전략
이 연구에서는 총 6개의 금속-유기 골격(MOF) 데이터베이스, 즉 CoRE-2019, BW20K, ARABG, QMOF, hMOF 및 CSD 하위 집합을 모델 훈련 및 평가에 사용했습니다.안에:
* hMOF는 매우 방대한 가상 구조 라이브러리를 제공하여 모델의 일반화 능력을 향상시키는 데 도움이 됩니다.
* BW20K와 ARABG는 다양성을 강화하고 소수 작업(fever-shot task)을 지원하는 데 사용됩니다.
* CSD 하위 집합은 실험적 편향 하에서 모델의 견고성을 테스트하는 데 사용됩니다.
연구팀은 CoRE 2019, BW20K, ARABG, QMOF, hMOF 데이터베이스의 결정 구조를 활용하고, pymatgen XRD 모듈을 이용하여 0도에서 90도까지의 PXRD 패턴을 시뮬레이션하여 합성 후 얻은 구조적 특성 정보를 실제 실험에서 시뮬레이션했습니다. 금속 노드와 유기 연결체로 구성된 화학 전구체 정보는 [금속 종류].[유기 연결체] 형식으로 구성되었으며, 단어 분할을 위해 모델의 변환기 채널에 입력되었습니다.
자기 감독 사전 학습을 기반으로 하는 다중 모드 학습 프레임워크
연구팀은 완전한 결정 구조에 대한 의존성을 없애는 것을 목표로, 자기 감독 사전 학습 기반의 다중 모드 학습 프레임워크를 제안했습니다.합성 후에 얻은 정보만을 사용하여 MOF의 특성과 잠재적 응용 분야를 예측합니다.
이 자기 지도 다중 모드 모델의 워크플로는 아래 그림에 나와 있습니다. 전구체 스트링과 분말 X선 회절(PXRD) 스펙트럼이 입력으로 사용되어 각각 변환기와 합성곱 신경망(CNN)을 통해 내장되고, 미세 조정을 위해 회귀 헤드로 전달됩니다. 전구체는 재료의 화학적 특성에 대한 정보를 제공하고, PXRD 패턴은 전체 기하학적 구조에 대한 추가 정보를 제공합니다.
Transformer에 의해 인코딩된 화학적 전구체 문자열과 CNN에 의해 처리된 PXRD 스펙트럼은 특징 스플라이싱과 투영을 통해 통합된 표현 공간으로 구성됩니다.연구팀은 "전구체 + PXRD"의 단점인 국소적 화학 환경을 직접적으로 특성화할 수 없다는 점을 보완하기 위해 자체 감독 사전 훈련 메커니즘을 도입했습니다.모델 출력은 CGCNN(크리스탈 그래프 합성 신경망)의 임베딩에 맞춰 조정되며, 교차 상관 행렬은 Barlow Twins 손실을 통해 단위 행렬에 가깝게 제한되어 모델이 국소 화학 환경의 표현력을 학습하도록 안내합니다.
이를 바탕으로, 대규모의 라벨이 지정되지 않은 데이터에 대한 자기 지도 학습을 거친 후, 모델은 제한된 라벨이 지정된 샘플로 빠르게 수렴하고 기공 구조, 화학적 의존성 특성 및 양자 화학적 특성에 대한 고정밀 예측을 달성할 수 있습니다.

구체적으로, MOF 데이터베이스에서 얻은 결정 구조를 기반으로,적은 양의 데이터로도 이 방법을 사용하면 다양한 특성을 정확하게 예측할 수 있습니다.여기에는 기공 구조, 화학적으로 의존적인 특성, 양자 화학적 특성이 포함됩니다.
자기 지도 및 학습 단계에서, Crystal Graph Convolutional Neural Network(CGCNN)와 모델 간의 표현 학습을 수행하기 위해 자기 지도 학습(SSL) 파이프라인을 구축하여 입력에서 MOF의 로컬 환경을 이해하지 못하는 모델의 한계를 극복했습니다. 모델의 가중치가 초기화되어 해로의 빠른 수렴이 가능해졌습니다. CGCNN 임베딩에 대해 자기 지도 학습을 수행했습니다. 크기가 512인 각 임베딩은 CGCNN과 모델의 프로젝터에서 추출되었으며, (512, 512) 모양의 교차 상관 행렬이 구성되었습니다. Barlow-Twin 손실 함수를 사용하여 차이를 최소화하여 교차 상관 행렬을 단위 행렬에 가깝게 만들어 표현 학습을 달성했습니다.
다중 모드 모델 평가
연구팀은 이 모델이 다양한 MOF 특성을 효과적으로 예측하고 MOF 합성과 응용의 기반을 마련할 수 있음을 증명하기 위해 스피어만 순위 상관 계수(SRCC)와 평균 절대 오차(MAE)를 사용하여 모델의 정확도를 평가했으며, 기하학적으로 종속적인 특성, 화학적으로 종속적인 특성, 양자 화학적 특성에서 모델의 예측 정확도를 평가하고 CGCNN, MOFormer, 기술자 기반 머신 러닝 모델과 벤치마크 비교를 수행했습니다.
결과는 다음과 같습니다이 모델의 모델 정확도는 완전한 결정 구조에 의존하는 모델의 정확도와 비슷합니다.기하학적 성능 면에서도 CGCNN과 MOFormer보다 우수한 성능을 보여 합성 정보만을 사용하여 고정확도의 속성 예측이 가능함을 입증하고, MOF 합성과 응용을 신속하게 일치시키기 위한 실험적 기반을 마련했습니다.

또한, 연구팀은 화학적 전구체에만 의존하는 모델과 PXRD에만 의존하는 모델을 본 연구에서 개발된 다중 모드 모델과 비교하는 삭마 실험을 수행했습니다. 그 결과, 화학적 전구체만 입력으로 사용하는 모델은 전체 MOF 구조를 효과적으로 포착하지 못했으며, 기하학적 특성과 순수 기하학적 특성에서 낮은 점수를 받았습니다. PXRD만 사용하는 모델은 전체 MOF 구조를 잘 포착했지만, 국소 환경을 반영하지 못해 화학 특성과 양자 화학적 특성(저압 및 밴드갭에서의 CO₂ 흡착 등)에서 낮은 점수를 받았습니다. 두 모델 모두 한계점을 보였습니다. 결과는 기하학적 정보를 제공하는 PXRD와 화학적 정보를 제공하는 전구체 스트링을 결합해야만 다중 모드 모델이 세 가지 특성 범주 모두에 대해 포괄적이고 정확한 예측을 달성할 수 있음을 보여줍니다. 두 가지 모드 중 하나만 사용하는 것은 성능이 현저히 떨어집니다.
모델 안정성 검증: 구조적 오류 및 실험 노이즈에 대한 견고성 평가
안정성은 머신 러닝 모델이 실제 시나리오에 안정적으로 적용될 수 있는지 평가하는 중요한 지표입니다. 이를 위해 연구팀은 비이상적인 조건에서 제안된 다중 모드 모델의 강건성을 체계적으로 평가했습니다. 먼저, 연구진은 케임브리지 구조 데이터베이스(CSD)에서 추출한 실험적 결정 구조를 사용하여 해당 PXRD 패턴을 계산하여 실제 실험에서 흔히 발생하는 구조적 편차(예: 수소 원자 누락, 결합 또는 비결합 용매 존재)를 시뮬레이션했습니다. 이 평가는 단일 기하 구조 관련 특성, 즉 메탄 저장 응용 분야에서 고압 하의 메탄 흡착 용량 예측에 중점을 두었습니다.
결과는 다음과 같습니다모델은 위의 변화 조건 하에서도 여전히 좋은 예측 능력을 유지할 수 있습니다.CH₄ 고압 흡착 성능 순위는 강력한 일관성을 보이며, 상대 오차는 13% 이하로 제어되어 높은 견고성을 보여줍니다.
이를 바탕으로 연구팀은 실제 측정된 PXRD 패턴을 추가로 도입하여 계측기 노이즈 및 온도 변동과 같은 실제 측정 오류에 대한 모델의 안정성을 검증하는 테스트를 수행했습니다. 일부 샘플에서는 시뮬레이션 패턴과 실험 패턴 간에 유의미한 차이가 있었지만, 이 모델은 대부분의 경우 시뮬레이션 패턴에 근접한 권장 결과를 제공하며, 상당한 노이즈나 뚜렷한 피크 정렬 불량이 있는 경우에만 차이를 보였습니다. 위의 실험 결과와 종합해 보면, 다중 모드 모델은 이상적인 구조 입력 조건에서 높은 예측 정확도를 가질 뿐만 아니라, 실험 구조가 불완전하거나 PXRD에 노이즈가 있는 경우에도 강건한 성능을 유지함을 보여줍니다.실제 재료 연구와 응용 분야에서 폭넓게 적용 가능하다는 것이 검증되었습니다.
아래 그림은 시뮬레이션된 PXRD 패턴과 실험된 PXRD 패턴의 차이점을 비교하여 모델 추천 결과를 보여줍니다.

합성-응용 통합 추천 시스템
이 모델의 인상적인 성능을 바탕으로, 연구진은 새롭게 합성된 MOF와 예측된 재료 특성을 기반으로 잠재적 응용 분야(예: 가스 저장 및 탄소 포집)를 매칭하는 시각적 잠재 응용 분야 추천 시스템을 개발했습니다. t-SNE 기술을 사용하여 이 시스템은 모달 모델의 잠재 공간을 투영하고 색상을 사용하여 MOF에 권장되는 응용 분야를 나타냅니다. 다음 그림은 합성 정보와 응용 시나리오 간의 매핑을 보여줍니다.

연구진은 이 모델이 미래의 재료 응용 분야를 예측하는 능력을 검증하기 위해 시간 여행 실험을 수행했습니다.이 모델은 2017년 이전 CSD 데이터베이스에 저장된 CoRE-2019 항목을 사용하여 학습되었으며, 2017년 이후에 저장된 항목을 사용하여 미래 소재에 대한 예측을 시뮬레이션하는 테스트를 거쳤습니다. 실험의 목표는 특정 응용 분야인 이산화탄소 흡착에서 이러한 MOF의 성능을 예측하는 것이었습니다. 그 결과, 이 모델은 탄소 포집 가능성이 있는 18개의 MOF를 성공적으로 식별했으며, 그중 15개는 원래 다른 응용 분야를 위해 설계된 것이었습니다.

이러한 MOF 중 일부와 해당 MOF에 기반한 예상 합성 응용 분야
머신 러닝은 재료 과학에 혁명을 일으키고 있습니다
이 논문은 결정 구조에 관계없이 MOF의 다양한 특성을 정확하게 예측하고 특정 응용 분야에 매칭하는 다중 모드 머신 러닝 접근법을 소개합니다. 이러한 데이터 기반 추세는 시공간적으로 더 광범위한 재료 시스템으로 확산되고 있습니다. 예를 들어, 베이징 과학기술대학교의 셰 지안신(Xie Jianxin)과 쑤 얀징(Su Yanjing)이 이끄는 연구팀은 재료 과학 분야에서 해석 가능한 머신 러닝의 적용을 연구했습니다. 그들은 재료 지식과 머신 러닝을 결합하면 모델의 일반화와 예측 정확도를 크게 향상시킬 수 있음을 입증하여 재료 과학 발전에 새로운 지평을 열었습니다. 관련 연구인 "해석 가능한 머신 러닝 응용 분야: 재료용 AI의 유망한 전망"은 Advanced Functional Materials에 게재되었습니다.
서류 주소:
https://advanced.onlinelibrary.wiley.com/doi/abs/10.1002/adfm.202507734
미국 아르곤 국립연구소 연구팀은 새로운 MOF 구조를 무작위로 생성하고 조립할 수 있는 생성적 AI 프레임워크인 GHP-MOFsassemble을 제안했습니다. 이 프레임워크는 분자 동역학 시뮬레이션을 사용하여 매우 안정적인 MOF를 선별하고, CGCNN(Crystal Graph Convolutional Neural Network)과 그랜드 캐노니컬 몬테카를로 시뮬레이션을 사용하여 MOF의 이산화탄소 흡착 능력을 테스트합니다. 관련 연구인 "탄소 포집을 위한 금속-유기 구조체 설계를 위한 분자 확산 모델 기반 생성적 인공지능 프레임워크"는 Communications Chemistry에 게재되었습니다.
서류 주소:
https://www.nature.com/articles/s42004-023-01090-2
옥스퍼드 대학교 연구팀은 "계산 재료 설계의 최전선으로서의 비정질 상태"라는 제목의 연구를 발표하며, 재료 설계의 기존 한계를 극복하는 데 있어 머신 러닝의 중요한 역할을 강조했습니다. 이 연구는 계산 모델링과 인공지능 분야의 최신 발전이 비정질 고체의 원자 규모 구조, 미시적 특성, 그리고 거시적 기능 간의 이전에는 간과되었던 연결 고리를 어떻게 연결할 수 있는지 보여주었습니다.
서류 주소:
https://www.nature.com/articles/s41578-024-00754-2
이 일련의 연구들은 재료 과학이 새로운 지능 시대로 접어들고 있으며, 머신 러닝이 주도하는 재료 연구 혁신의 한가운데에 있다는 명확한 그림을 그려냅니다. 더 중요한 것은 지능이 신소재의 설계 및 합성에서 응용 분야로 점차 확장되고 있으며, 이는 신소재 구현을 더욱 촉진할 것이라는 점입니다.
참고문헌:
1.https://pubs.acs.org/doi/10.1021/cr300014x
2023년부터 2024년까지 AI4S 분야의 고품질 논문과 심층 해석 기사를 클릭 한 번으로 받아보세요⬇️
