타겟 속성 재료를 직접 디자인하세요! Microsoft의 MatterGen 모델은 이제 오픈 소스로 출시되어 생성 AI를 통해 재료 역설계의 새로운 패러다임을 재정의합니다.

2023년 12월, 구글 딥마인드는 재료화학 분야에서 딥러닝 모델인 GNoME을 '네이처'에 게재하며, 무기 물질의 220만 개의 새로운 결정 구조를 발견했다고 주장했습니다. 이 획기적인 발전 이후 일주일도 채 지나지 않아 Microsoft는 역소재 설계를 위한 생성 AI 모델인 MatterGen을 출시한다고 발표하고 모든 사람에게 다음과 같이 말했습니다.미래에는 필요한 특성에 따라 새로운 소재의 구조를 직접 설계하는 것이 가능해질 것입니다.

Google의 GNoME 모델이 AI가 광대한 화학 분야에서 새로운 물질을 빠르게 발견할 수 있는 잠재력을 가지고 있음을 보여준다면, Microsoft의 MatterGen은 생성 AI가 역설계를 통해 특정 요구 사항을 정확하게 충족할 수 있는 능력을 다시 한번 입증합니다. 두 사례는 재료 화학 분야에서 AI가 진입하는 지점이 다르다는 것을 보여주며, 대규모 발견에서 "주문형 설계"로의 새로운 기술적 도약을 보여줍니다. 1월 16일, MatterGen의 연구 결과가 "무기 재료 설계를 위한 생성 모델"이라는 제목으로 마침내 Nature에 게재되었습니다. 더욱 흥미로운 점은 이 모델이 이제 오픈 소스라는 것입니다.HyperAI는 공식 웹사이트에 "MatterGen 무기 재료 설계 모델 데모" 튜토리얼을 출시했습니다. 한 번의 클릭으로 배포하고 실행할 수 있습니다. 누구나 모델 성능을 테스트해 볼 수 있습니다.
튜토리얼 주소:https://go.hyper.ai/5mWaL

동남대학 왕진란 교수는 "심층 생성 모델을 통한 역설계: 재료 발견의 다음 단계"라는 논문에서, 기존의 머신 러닝 기반 재료 설계 연구에서는 대부분이 화학 분야 전체에서 후보 재료의 특성을 예측하고 대규모 스크리닝을 수행하여 목표 성능을 가진 잠재적 재료를 찾았지만, 역설계는 최적의 경로를 따라 적격 화합물을 직접 생성할 수 있다고 지적했습니다. 그녀는 생성 모델이 재료의 역설계를 위한 효과적인 전략이라고 믿으며, 이는 Microsoft의 연구와 일치합니다.
MatterGen은 확산 모델을 기반으로 하며 대상 공간 그룹에 따라 구조를 생성할 수 있습니다. 예를 들어, 다중 속성 자성 재료를 설계할 때 높은 자기 밀도와 낮은 공급망 위험 화학 조성을 모두 갖춘 구조를 제안합니다. 동시에 이 모델은 화학적 특성, 대칭성, 재료 특성 등의 제약 조건에 따라 미세 조정할 수 있는 여러 개의 조정 가능한 적응 모듈을 갖추고 있어 특정 자기적, 전자적 또는 기계적 특성을 충족하는 재료를 생성하고 DFT를 통해 이를 검증할 수 있습니다. 이를 통해 특정 시나리오에 맞춰 새로운 소재를 "맞춤형으로 제작"하는 것이 가까운 미래에 현실이 될 수 있음을 알 수 있습니다.
위에서 언급한 확산 모델 외에도 오늘날의 주류 생성 모델에는 생성적 적대 신경망(GAN), 변형 자동 인코더(VAE), 자기 회귀 모델 등이 포함됩니다. 이러한 모델의 핵심 원리는 데이터 분포를 학습하여 새로운 샘플을 생성하는 것입니다.
이 글에서 HyperAI는 신소재의 역설계에서 생성 모델의 가치를 소개하고, 배터리 소재, 고엔트로피 합금, 초전도 소재 등에서 이 기술이 구체적으로 어떻게 발전했는지 살펴봅니다.
신소재 개발과 단백질 설계의 유사점
전형적인 재료 개발 문제에서 우리는 특정 속성을 지닌 새로운 재료를 찾고 싶어하는데, 이는 실제로 목표 속성과 일치하는 적절한 결정 구조를 찾는 문제입니다.
과거에는 새로운 소재를 개발할 때 주로 시행착오에 의존했습니다. 이러한 "전방적 설계"는 구조에서 속성까지의 발견이 특징입니다. 가장 일반적인 치환법을 예로 들면, La-Ba-Cu-O 초전도체는 최초의 구리 기반 초전도체이지만, 액체질소 온도 영역보다 낮은 35K에서만 초전도 현상을 보입니다. 연구진은 구조부터 La을 Y 원소로 대체하여 실험한 결과, Y-Ba-Cu-O 초전도체의 초전도 온도가 액체질소 온도 영역보다 높은 것을 확인했습니다. 하지만 이 방법의 연구 개발 주기는 매우 길고 우연성이 높습니다.
컴퓨터 기술과 양자역학 이론의 발전으로 밀도 함수 이론(DFT)을 기반으로 한 물질 예측 방법이 점차 성숙되었습니다. 구조 검색 알고리즘과 고처리량 컴퓨팅을 결합하면, 특정 제약 조건에 따라 특정 데이터베이스에서 잠재적인 소재를 효율적으로 검토한 다음, 합성 및 테스트를 위해 실험실로 보낼 수 있습니다. 그러나 알려지지 않은 물질의 화학적 공간은 엄청나게 넓고, 다양한 원소의 잠재적인 조합은 수백만 개에 달할 수도 있기 때문에 대규모 스크리닝의 계산 비용이 매우 많이 듭니다.
AI 기반 역방향 설계는 새로운 사고방식을 제공합니다. 이는 재료 공간 스크리닝의 관성적 사고에서 벗어나 목표 성능을 충족하는 재료 구조를 직접 생성하여 재료의 효율적인 설계와 최적화를 달성합니다.
실제로 AI 기반 역설계는 생물의학 분야에서 획기적인 진전을 이루었습니다. 2024년 10월, 노벨 화학상은 처음으로 AI 분야와 연관되었으며, 상의 절반은 단백질 설계에 대한 뛰어난 공헌을 인정받아 워싱턴 대학의 데이비드 베이커에게 수여되었습니다. 그의 많은 연구에서 우리는 기능성 신규 단백질을 설계하기 위해 아미노산 서열을 생성하는 데 딥러닝을 역으로 활용한 예를 볼 수 있습니다.

새로운 소재 연구 및 개발과 단백질 설계 사이에는 많은 유사점이 있습니다. 예를 들어, 물질의 거시적 특성은 미시적 구조에 의해 결정되고, 단백질의 경우도 마찬가지입니다. 단백질 분야에서 아미노산 서열은 단백질이 특정한 2차, 3차, 심지어 4차 구조로 접히는 과정을 안내하며, 이는 결국 단백질의 생물학적 기능을 결정합니다. 마찬가지로, 재료 과학은 원자, 화학 결합, 작용기의 선택과 배열에 의존하여 분자나 보다 복잡한 물질 구조를 만들고, 이를 통해 분자의 특성을 결정합니다.
이러한 유사성 덕분에 단백질 설계에서 널리 사용되는 AI 방법은 역설계를 통한 재료 특성 최적화, 새로운 구조 탐색, 완전히 새로운 재료 개발 등 재료 과학 연구에 대한 통찰력을 제공할 수 있습니다.
동시에 생물의학 분야에서 등장한 강화 학습, 주의 메커니즘, 확산 모델, 사전 학습 모델, 멀티모달 기술, 모델 정렬 메커니즘 등의 다른 생성 모델, 시각 모델, 언어 모델 및 기타 고급 기술도 재료 과학에 광범위한 응용 잠재력을 가지고 있습니다.
새로운 소재는 생물의학의 긴 임상시험 주기를 거칠 필요가 없고, 윤리적 안전 등의 요소의 영향을 배제할 수 있기 때문에 실제 구현 가능성이 더 클 수 있다는 점도 언급할 가치가 있습니다.
Microsoft MatterGen을 예로 들면서 재료의 생성적 AI 역설계의 새로운 패러다임을 살펴보겠습니다.
Microsoft의 MatterGen 모델은 주로 확산 아키텍처를 기반으로 합니다. 먼저 원자 유형, 원자 위치, 주기 격자를 점진적으로 파괴하여 무작위 구조를 만든 다음, 이 과정을 역으로 완료하도록 모델을 훈련시켜서 모델이 무작위 노이즈에서 점진적으로 원래 물질 구조를 복원하는 방법을 학습할 수 있도록 합니다. 논문의 책임저자인 셰톈은 이것이 비디오 생성의 핵심 아이디어와 매우 유사하다고 생각합니다.
OpenAI가 개발한 Vincent 비디오 모델 Sora를 예로 들면, 연구진은 자동 인코더 기반 "비디오 압축 네트워크" 기술을 사용하여 입력 이미지나 비디오를 저차원 데이터로 압축하고, 이 압축된 비디오를 "시공간 패치"로 분해했습니다. 이는 다시 Transformer 처리를 위한 1차원 데이터 시퀀스로 변환되었습니다. 그런 다음 변환기는 각 시공간 패치의 노이즈 제거를 완료하고, 디코더는 처리된 텐서 데이터를 비디오로 복원합니다.

반면, 연구진은 확산 구조를 기반으로 모델이 알려진 안정적인 물질 데이터의 구조를 학습하도록 했습니다. 모델이 훈련되면 무작위 분포에서 무조건적으로 샘플링을 수행하고 역방향 프로세스를 거쳐 모델이 재료 법칙에 대한 이해를 바탕으로 조건을 충족하는 새로운 재료 구조를 생성할 수 있습니다. 더 나아가 연구진은 기본 모델을 미세하게 조정하기 위해 네트워크의 각 계층에 조건을 추가했습니다. 이러한 조건은 특정 화학적 특성, 대칭성 또는 모든 목표 특성(자성, 밀도 등)일 수 있습니다. 미세 조정 후,이 모델은 지정된 조건에 따라 재료 구조를 직접 생성하고 계산 방법을 통해 안정성을 검증할 수 있습니다.
아래에 표시된 것처럼 스트론튬-바나듐-산소 화학 시스템에 대한 새로운 물질 생성의 경우 MatterGen에서 생성된 물질 구조는 매우 합리적으로 나타나며(fi), 계산을 통해 이러한 물질이 안정적임이 검증되었습니다.

연구팀은 컴퓨터 검증 외에도 중국과학원 산하 선전선진기술원과 협업하여 MatterGen을 사용하여 새로운 물질인 TaGr을 성공적으로 합성했습니다.2영형6실험적으로 측정된 체적 탄성률은 169 GPa로, 20%의 설계값인 200 GPa보다 상대오차가 낮습니다. 동시에 연구팀은 과학자들로부터 피드백을 받고, 모델의 실질적 적용 가치를 개선하기 위해 모델을 계속 반복하고 최적화하고자 합니다.
대부분의 재료 설계 문제는 실온 초전도체나 배터리용 초이온 전도체와 같이 극단적인 특성을 지닌 재료를 찾는 것과 관련이 있기 때문에 기존의 탐색 기반 방법은 구현하기 어렵지만, 생성 모델은 목표 특성에 따라 움직이며 이러한 획기적인 재료를 발견할 수 있는 기회를 제공할 수 있습니다.Microsoft는 이 모델을 사용하여 배터리 설계, 태양 전지 설계, 탄소 포집을 포함한 다양한 소재를 탐색하고 있습니다.
추가 응용 분야: 고엔트로피 합금 및 초전도 재료 개발을 예로 들어 보겠습니다.
우리 모두는 새로운 소재가 항공우주, 신에너지, 전자정보, 생물의학 등 첨단기술 분야의 개발을 촉진하는 초석일 뿐만 아니라 새로운 기술, 새로운 장비, 새로운 프로젝트를 지원하는 기반이 된다는 것을 알고 있습니다. 하지만 우리나라의 현재 소재산업은 여전히 전통적인 소재가 주도하고 있으며, 신소재, 특히 고급 신소재의 공급은 제한적입니다. 동시에 핵심기술 부족으로 인해 원자재를 수입에 일정부분 의존하고 있으며, 인력부족으로 인한 제약을 받는 문제가 여전히 두드러진다.
요즘에는 생성적 AI의 발전으로 재료 과학은 새로운 연구 패러다임 변화를 선도하고 있습니다. 가능한 한 일찍 이 새로운 분야에 진출한다면, 단점을 극복하고 "커브에서의 추월"을 달성할 가능성이 생길지도 모릅니다. 다음으로, 고엔트로피 합금, 초전도체 소재 및 기타 응용 분야의 개발에서 생성적 AI의 구체적인 사례를 통해 이 기술이 새로운 소재의 획기적인 개발을 달성하는 데 어떻게 도움이 될 수 있는지 살펴보겠습니다.
고엔트로피 합금
가스터빈, 원자로, 항공우주 추진 시스템과 같은 엔지니어링 분야에서는 우수한 고온 기계적 특성을 갖춘 금속 합금에 대한 수요가 많습니다. 내화성 고엔트로피 합금(RHEA)은 다양한 고융점 내화 원소를 첨가하여 1000°C 이상의 온도에서도 높은 강도를 유지할 수 있으며, 고온 합금과 비슷한 고온 강도를 보여 연구자들의 폭넓은 관심을 받고 있습니다.
그러나 다른 고온 합금과 비교해 볼 때, RHEA의 성능은 특정 측면(실온 연성 등)에서는 여전히 어렵습니다. 과거에는 RHEA 설계가 주로 연구자의 경험과 직관에 의존했기 때문에 불확실성이 매우 컸습니다. 동시에 RHEA의 가능한 구성 공간은 넓고, 수십억 개의 후보 구성 요소를 포함하고 있어 잠재적 합금을 신속하게 발견하는 데 큰 제한이 있습니다.
이와 관련하여, 펜실베이니아 주립대학교 재료과학 및 공학과 조교수이자 계산 및 데이터 과학 연구소 조교수인 웨슬리 라인하트는 Journal of Materials Informatics에 "고엔트로피 내화 합금의 역설계를 위한 도구로서의 생성적 딥 러닝"이라는 제목의 논문을 발표하고, 생성적 모델이 재료 설계, 특히 고엔트로피 합금의 설계를 위한 유망한 새로운 방법이라는 예비적 결론을 도출했습니다. 이 결과는 JMI로부터 올해의 최고 논문으로 평가되었습니다.
서류 주소:
https://www.oaepublish.com/articles/jmi.2021.05
이 논문에서 연구진은 지난 10년 동안 밀도 함수 이론(DFT)과 같은 계산적 방법이 기본적으로 성숙해지고 많은 양의 데이터가 축적되었으며, 이를 통해 딥러닝을 적용할 수 있는 기반을 제공하고 "전방 모델"의 개발이 촉진되었다고 언급했습니다. 안타깝게도, 방대한 디자인 공간은 여전히 주요 과제입니다. 생성 모델링의 "역설계"는 이에 대한 해결책을 제공합니다.
따라서 연구진은 생성기에 출력을 제어하기 위한 추가 조건 벡터를 제공하기 위해 조건부 생성적 적대 신경망(CGAN)을 사용했습니다. 즉, 조건 벡터는 대상 속성(합금 구성이나 성능 지수 등)과 관련된 정보를 제공하고, 잠재 공간과 원하는 지수 간의 매핑을 설정하고, 생성기는 합금 구성에 기반한 합금 성능 데이터의 확률 분포를 학습하여 조건을 충족하는 샘플을 생성합니다. 이 모델은 알루미늄 합금에 대해 성공적으로 설계되었으며 계산적 방법을 통해 검증되었다는 점이 언급할 가치가 있습니다.

연구자들은 CGAN을 사용하는 것 외에도 조건부 변분 자동 인코더(CVAE)를 새로운 소재 설계에 사용할 수 있다고 언급했지만, 학습 과정에서 내재적인 노이즈 주입과 재구성 오류에 대한 사전 정의된 측정 요구 사항 때문에 VAE는 GAN만큼 효과적이지 않습니다.
초전도 재료
초전도체란 특정 온도에서 저항이 0이 되는 도체를 말합니다. 이러한 기술은 전력 전송, 모터, 운송, 항공우주, 마이크로 전자공학, 전자 컴퓨터, 통신, 핵물리학, 신에너지, 생체공학, 의료 및 군수 장비 등 광범위한 분야에 적용됩니다. 초전도 현상이 발견된 이래로 이 분야에서는 관련 노벨상이 많이 나왔습니다.
높은 임계 온도(Tc)를 가진 새로운 초전도체를 발견하는 것은 재료 과학과 응집 물질 물리학 분야에서 늘 중요한 과제였습니다. 미국 국립표준기술연구소와 마이크로소프트의 다른 연구자들은 독특한 구조와 화학 조성을 가진 초전도체를 생성하기 위한 새로운 확산 모델을 제안했습니다. 이 연구의 제목은 "데이터 기반 딥 생성 모델을 사용한 차세대 초전도체의 역설계"였으며 The Journal of Physical Chemistry Letters에 게재되었습니다.
서류 주소:
https://pubs.acs.org/doi/10.1021/acs.jpclett.3c01260
이 연구에서 연구자들은 생성 모델을 주기적 물질에 적용하는 데 있어서 주요 과제는 평행 이동 및 회전 불변의 표현을 만드는 것이라고 언급했는데, 이 문제는 결정 확산 변분 자동 인코더(CDVAE)를 사용하여 해결할 수 있습니다.

따라서 연구진은 위 그림에서 보듯이 1,058개의 초전도체 물질의 DFT 데이터로 CDVAE 모델을 학습시켜 3,000개의 새로운 초전도체 후보 물질을 생성했습니다. 이후, 사전 학습된 딥러닝 모델 ALIGNN을 사용하여 이들 후보 구조의 초전도 특성을 예측하였고, 스크리닝을 거쳐 61개의 후보 물질이 얻어졌습니다. 마지막으로 연구진은 이러한 재료에 대한 DFT 계산을 수행하여 예측을 검증하고 새로운 재료의 동적 및 열역학적 안정성을 평가했습니다. 아래 그림은 15개의 잠재적 후보 초전도 물질의 구조를 보여줍니다. 연구 결과, 이러한 접근 방식을 통해 차세대 소재의 역설계가 가능함을 발견했습니다.

물론, 위에서 언급한 사례 외에도 생성 모델은 다른 머티리얼 디자인에 적용되었습니다. 저자는 여러분의 참고를 위해 몇 가지 사례를 특별히 정리했습니다.
*리튬 배터리 설계
논문 제목: 생성적 AI를 활용한 미세구조 최적화를 통한 리튬이온 배터리 설계
서류 주소:
https://www.cell.com/matter/fulltext/S2590-2385(24)00446-6
*나노복합소재 설계
논문 제목: 나노복합재료의 맞춤형 기능을 위한 생성 AI
서류 주소:
https://easychair.org/publications/preprint/sDm2
*2D 소재 디자인
논문 제목: 딥러닝 생성 모델을 이용한 새로운 2D 재료의 계산적 발견
서류 주소:
https://pubs.acs.org/doi/abs/10.1021/acsami.1c01044
*엔지니어링 시멘트 기반 복합재료 설계
논문 제목: 엔지니어링 시멘트 복합재의 성능 기반 설계를 위한 생성 AI
서류 주소:
https://www.sciencedirect.com/science/article/abs/pii/S1359836823004961
*기계 및 생체모방 소재 설계
논문 제목: 생성적 AI 접근 방식을 통한 기계적 및 생물학적 영감 소재 향상
서류 주소:
https://www.sciencedirect.com/science/article/pii/S2949822824001722
마지막 말
현재, 재료 디자인 분야에서 생성 AI를 적용한 사례는 대부분 아직 실험 단계에 있습니다. 기술을 실제로 구현하려면 계산을 통해 재료의 특성을 평가하는 것 외에도 실제 환경에서의 실험적 검증에 의존하는 것도 필요합니다. 이런 측면에서, 컴퓨터 스크리닝과 새로운 소재의 실험적 합성 간의 격차를 줄이고 최소한의 인력으로 빠르게 소재를 발견하려면 자동화된 실험실을 구축하고 폐쇄 루프 발견을 달성하는 것이 특히 중요합니다.
캘리포니아 대학교 버클리 캠퍼스의 자동화 연구실인 A-Lab을 예로 들어보겠습니다. 실험 단계를 자동으로 실행할 수 있을 뿐만 아니라, 데이터에 기반하여 독립적으로 결정을 내릴 수도 있습니다. 17일간의 연속 운전을 통해 58개의 표적 물질 중 41개를 성공적으로 합성하여 성공률은 71%였습니다. 이는 생성적 AI를 사용하여 소재를 설계하고 자동화된 실험실을 통해 효율적인 합성과 검증을 수행하는 것이 재료 과학의 급속한 발전을 촉진하는 효과적인 방법이 되고 있음을 보여줍니다.
참고문헌:
1.https://nullthought.net/?p=5222&utm_source=chatgpt.com
2.https://academic.oup.com/nsr/article/9/8/nwac111/6605930?login=false
3.https://mp.weixin.qq.com/s/UX71cMgsEo49tLPiFu3D8A
4.https://mp.weixin.qq.com/s/e1DqTa1Tgyi4OWpgwrj48Q
5.https://www.youtube.com/watch?v=Smz1go6_Spo&t=896s
6.https://www.youtube.com/watch?v=yWXPV3bsC2c&t=7s
7.https://www.youtube.com/watch?v=Uv22eVcmmXA
