MIT는 물리적 사전 확률을 기반으로 한 생성적 AI 모델을 구축하여 단일 스펙트럼 모달 입력만으로 최대 99%의 실험적 상관관계를 갖는 교차 모달 스펙트럼 생성을 달성했습니다.

인공지능의 등장은 재료 과학 분야에 새로운 발전을 가져왔습니다. AI의 힘을 활용하여 연구자들은 전례 없는 속도로 새로운 소재를 설계할 수 있습니다. 그러나 이러한 속도 또한 문제가 되었습니다.
AI는 너무 빠르게 발전하고 있으며, 실험적 검증은 따라잡을 수 없습니다.신소재 상용화의 마지막 관문인 분광학적 특성 분석은 여전히 기존 방식에 제약을 받고 있습니다. 이를 위해서는 특수 장비가 필요한데, 장비당 50만 달러 이상의 비용이 소요되고, 해석에는 전문 인력이 필요합니다. 더욱이 많은 시료가 희소하거나, 손상되기 쉽거나, 심지어 독성이 강하여 반복 실험이 불가능하다는 점이 신소재의 상용화를 저해합니다.
AI에 또 도움을 요청하시나요? 안타깝게도 현재 딥러닝 기술은 단순 분류 및 회귀 분석에 집중하고 있으며, 변분 자동 인코더(VAE)의 출력은 스펙트럼 표현 생성에 필요한 고충실도 데이터 요건을 충족하지 못합니다.
이 딜레마를 해결하려면MIT 연구팀은 단일 스펙트럼 모달 입력만으로 실험 결과와 상관관계가 99%인 교차 모달 스펙트럼 생성을 달성할 수 있는 물리적 사전 생성 인공지능 모델인 SpectroGen을 제안했습니다.이 기술은 두 가지 핵심 혁신을 도입합니다. 첫째, 스펙트럼 데이터를 수학적 분포 곡선으로 표현하고, 둘째, 물리적 사전 확률에 기반한 변분 자동 인코더 생성 알고리즘을 구축합니다. 기존 특성 분석의 낮은 효율성과 높은 비용을 해결하는 동시에, 물질의 "발견 및 검증"이 "동일한 속도로 공명"할 수 있도록 합니다.
관련 연구는 "SpectroGen: 가속화된 교차 모달리티 분광 재료 특성화를 위한 물리적으로 정보를 제공하는 생성적 인공 지능"이라는 제목으로 Matter에 게재되었습니다.
연구 하이라이트:
* 물리학에서 영감을 받아 모델과 자동 인코더를 결합했습니다.
* 물리적 사전 확률을 핵심으로 사용하여 고충실도 스펙트럼 생성을 촉진합니다.
* 인공지능은 재료 과학에서 발견과 검증의 동시적 속도를 촉진합니다.

서류 주소:
https://www.cell.com/matter/abstract/S2590-2385(25)00477-1
공식 계정을 팔로우하고 "spectral characterization"에 답글을 남겨 전체 PDF를 받으세요.
더 많은 AI 프런티어 논문:
https://hyper.ai/papers
스펙트럼 데이터를 수학적 분포 곡선으로 변환
모델의 정확도가 실험 데이터와 일치하는지 확인하기 위해, 연구팀은 6,066개의 표준 시료를 포함하는 국제적으로 이용 가능한 표준 광물 스펙트럼 데이터베이스인 RRUFF 데이터베이스를 기반으로 모델을 학습하고 검증했습니다. 이 연구에서는 데이터베이스에서 319개의 IR-라만 스펙트럼 쌍과 371개의 XRD-라만 스펙트럼 쌍을 실험 데이터로 선택했습니다.모든 데이터는 수학적 분포 곡선으로 표현됩니다. 스펙트럼 특성을 기반으로 가우시안, 로렌츠, 보이트 분포를 물리적 사전 확률 분포로 사용하여, 모델이 실제 스펙트럼에서 피크 위치, 확장 및 신호 특성을 포착할 수 있도록 합니다.


물리학에서 영감을 받은 아키텍처 + 변형 자동 인코더
SpectroGen의 핵심 아이디어는 물리학을 기반으로 생성 인공지능을 통해 스펙트럼 모달리티 전반에 걸쳐 고충실도 매핑을 구현하는 것입니다. 전체 아키텍처는 VAE(Variational Autoencoder) 프레임워크를 기반으로 합니다.이 모델은 스펙트럼 분포를 입력으로 받고 인코딩과 디코딩의 양방향 매핑 프로세스를 통해 잠재 공간에서 서로 다른 스펙트럼 모드 간의 대응 관계를 학습하여 적외선(IR) 또는 X선 회절(XRD) 스펙트럼을 라만 스펙트럼으로 변환합니다.
실험 스펙트럼을 수학적 분포 곡선으로 분해한 후, 모델은 확률적 인코더를 사용하여 입력 스펙트럼을 잠재 변수에 매핑합니다. 물리적 사전 제약 조건 하에서 인코더는 분포 특성을 학습합니다. 그런 다음 디코더는 목표 모달 스펙트럼을 재구성하여 교차 영역 생성을 달성합니다. 생성된 스펙트럼과 실제 스펙트럼 간의 분포 차이를 최소화하기 위해 학습 과정에서 KL 발산 손실을 도입하여 생성된 결과의 정확성을 보장합니다.

실험적 획득과 비슷한 정확도
연구팀은 여러 비교 실험을 통해 모델의 성능을 체계적으로 검증했습니다. IR-라만 및 XRD-라만 작업에 초점을 맞춰, 먼저 분광 특성과 이미지 유사도를 기반으로 생성된 결과를 분석했습니다. 평가 지표에는 구조적 유사도(SSIM), 평균 제곱근 오차(RMSE), 그리고 상관계수가 포함되었습니다.
실험 결과에 따르면 SpectroGen은 두 가지 유형의 작업 모두에서 실험적으로 수집된 데이터와 매우 일관된 스펙트럼 생성을 달성합니다.IR-라만 변환 작업에서 생성된 스펙트럼은 피크 모양, 세기, 그리고 잡음 제어 측면에서 탁월한 성능을 보였으며, 평균 SSIM은 0.96±0.03, RMSE는 0.010±0.006, 그리고 실험 스펙트럼과의 상관 계수는 0.99±0.01이었습니다. XRD-라만 작업에서 이 모델은 0.97±0.04의 SSIM과 43±4 dB의 PSNR을 기록하며 복잡한 피크 모양과 중첩되는 신호를 모델링하는 능력을 더욱 입증했습니다.이는 관련 모드의 각 스펙트럼을 표현하기 위해 정확한 물리적 사전 확률을 사용하고 변형 자동 인코더 백본 아키텍처를 채택함으로써 달성됩니다.

두 번째로, 연구팀은 생성된 스펙트럼의 정보 무결성을 검증하기 위해 자신들이 생성한 스펙트럼을 사용하는 성능과 실험적으로 얻은 스펙트럼을 사용하는 성능을 물질 유형 분류 작업에서 더욱 비교했습니다.26가지 유형의 광물 재료에 대한 10차례의 반복 검증에서 SpectroGen이 생성한 스펙트럼은 평균 정확도 90.476%(테스트 세트 정확도: 50.100%)를 달성했으며, 실험적으로 수집된 스펙트럼의 평균 분류 정확도는 69.879%(테스트 세트 정확도: 61.644%)였습니다.테스트 세트의 낮은 정확도와 관련하여 연구팀은 데이터 세트의 크기가 작기 때문일 수 있다고 생각합니다. 전반적으로, 이 모델은 분자 진동을 반영하는 특징적인 정보를 여전히 효과적으로 전달할 수 있습니다.

마지막으로, 연구팀은 물리적 사전 확률의 중요한 역할을 탐구했습니다. 적외선 스펙트럼을 로렌츠 분포로 잘못 모델링하거나 XRD 스펙트럼을 가우시안 분포로 잘못 표현하는 경우, 생성된 스펙트럼의 피크 높이, 신호 대 잡음비, 그리고 피크 모양이 크게 저하됩니다.이는 네트워크 해석에 있어 물리적 사전 모델의 핵심 역할을 강조하며, 이를 통해 정확한 생성을 달성하는 데 도움이 됩니다.
인공지능이 주도하는 재료과학의 새로운 패러다임
본 논문에서 소개하는 연구는 인공지능의 지원을 통해 물리적인 기구가 필요 없이 스펙트럼 분석을 수행하는 방법을 제시했습니다.인공지능은 재료 과학 분야에서 특성 분석 단계를 훨씬 넘어서 재료 특성 예측 및 응용 분야 권장 사항까지 확장되어 활용도가 높다는 점이 주목할 만합니다.
캐나다 토론토 대학교 화학공학 및 응용화학과 연구팀은 다중 모드 머신 러닝 모델을 기반으로 한 새로운 접근법을 제안했습니다. 이 접근법은 MOF 합성 직후에 얻을 수 있는 분말 X선 회절(PXRD) 패턴 및 합성에 사용된 화학물질과 같은 정보를 활용하여 MOF의 잠재적 특성과 응용 분야를 예측합니다. 또한, 이 모델은 합성 직후 MOF의 응용 분야를 즉시 제안하는 응용 분야 추천 시스템을 통합했습니다. "다중 모드 머신 러닝을 사용하여 금속-유기 골격체 합성과 응용 분야 연결"이라는 제목의 이 연구는 Nature Communications에 게재되었습니다.
서류 주소:
https://www.nature.com/articles/s41467-025-60796-0
홍콩 이공대학교 연구팀이 개발한 RingFormer 프레임워크는 원자-화학 고리 기반의 계층적 그래프 변환기 아키텍처를 로컬 메시지 전달 및 글로벌 어텐션 메커니즘과 결합하여 분자의 광전자적 특성을 정확하게 예측합니다. 하버드 대학교 청정 에너지 프로젝트 데이터베이스(CEPDB)의 테스트 세트에서 RingFormer 프레임워크의 성능은 기존 방식 대비 22.771 TP³T 향상되었습니다. 관련 연구인 "RingFormer: 유기 태양 전지 특성 예측을 위한 링 강화 그래프 변환기"는 AI 분야 최고 학술 대회인 AAAI 2025 학회에 선정되었습니다.
서류 주소:
https://doi.org/10.48550/arXiv.2412.09030
과거에는 재료 과학이 인공지능에 의해 주도되는 새로운 패러다임에 진입했다고 말했었습니다. 이제 이러한 변화의 궤적은 점차 명확해지고 있으며, 거시적 패러다임에서 더욱 세분화되고 다각화된 심층적 발전 경로로 전환되고 있습니다. 이를 통해 우리는 더 많은 미지의 영역을 탐구할 수 있게 되었습니다.