HyperAI초신경

MIT 연구팀은 대규모 모델을 사용해 25종의 시멘트 클링커 대체 소재를 선별, 온실가스 배출량을 12억 톤 감축하는 효과를 냈다.

特色图像

시멘트 생산은 전 세계 온실가스(GHG) 배출의 주요 원인 중 하나로, 전 세계 인위적인 온실가스 배출량의 6% 이상을 차지합니다. 이러한 환경적 부담은 주로 시멘트 클링커 생산 공정에서 기인하는데, 이 공정에는 석회석을 고온(>950°C)에서 소성(CaCO₃→CaO+CO₂)하는 화학 반응과 높은 에너지 소비가 포함됩니다. 전 세계적인 인프라 수요 증가와 인구 증가에 따라,MIT 팀의 논문에 따르면, 시멘트 생산량은 2050년까지 20% 더 증가할 것으로 예상되며, 이는 환경적 압박을 더욱 심화시킬 것입니다.

기존 시멘트 클링커 교체 전략은 주로 플라이 애시(석탄 연소의 부산물)와 과립 고로 슬래그(강철 생산의 부산물)에 의존하는데, 이는 기계적 특성을 유지하면서 최대 50%의 클링커 질량을 교체할 수 있어 이론적으로 50%만큼 온실가스 강도를 줄일 수 있습니다.하지만 지난 20년 동안 석탄 에너지 생산 감소와 철강 재활용 증가로 인해 전체 시멘트 생산량에서 차지하는 공급량은 25%에서 17%로 감소했습니다.바이오매스 재, 폐유리 분말, 도시 고형 폐기물 소각재와 같은 새로운 대체 물질은 잠재력을 가지고 있지만, 불안정한 반응성과 계절적 공급 변동과 같은 문제점을 안고 있습니다. 따라서 더욱 지속가능하고 안정적인 대체 물질 개발이 시급합니다.

더욱 실현 가능한 대체 물질을 체계적으로 식별하기 위해, 매사추세츠 공과대학교(MIT)의 소루쉬 마흐주비(Soroush Mahjoubi), 엘사 A. 올리베티(Elsa A. Olivetti) 등은 혁신적인 다중 소스 데이터 통합 방법을 제안했습니다. 대규모 언어 모델(LLM)을 기반으로 하는 이 방법은 88,000편의 논문에서 14,000개 물질의 화학 조성을 추출한 후, 다중 헤드 신경망을 사용하여 물질의 반응 활성(열 방출, 수산화칼슘(Ca(OH)₂) 소모, 결합수)을 예측하고 통합 활성 평가 프레임워크를 구축합니다.전 세계적으로 50,000개 이상의 천연 및 산업 부산물의 반응성을 처음으로 확인하고 정량화했으며, 시멘트 클링커를 대체할 수 있는 잠재력이 있는 25가지 천연 암석 유형을 선정했습니다.연구에 따르면 건설 철거 폐기물, 소각재, 화산암과 같은 천연 소재는 반응성이 매우 높아 전 세계 클링커 사용량의 약 50%를 대체할 수 있으며, 이는 온실 가스 배출량을 12억 톤 줄이는 효과에 해당합니다.

관련 연구는 "2차 및 천연 시멘트 전구체의 데이터 기반 소재 선별"이라는 제목으로 Communication Materials에 게재되었습니다.

연구 하이라이트

* LLM과 신경망을 통합한 다중 규모 반응성 모델링 프레임워크를 제안하여 대체 재료의 시멘트 반응성을 균일하게 평가

* 14,000여종의 재료와 1,200여종 이상의 암석을 포괄하는 세계 최대 규모의 시멘트 대체재 데이터베이스 구축으로 기존 실험 스크리닝의 한계를 극복

* 25가지 천연 암석 유형이 높은 반응성을 갖는 것으로 밝혀졌으며, 이는 글로벌 시멘트 산업에서 탄소 배출을 크게 줄일 수 있는 지역 클링커 대체 전략을 지원합니다.

서류 주소: 

https://go.hyper.ai/ZOAaW

더 많은 AI 프런티어 논문:
https://go.hyper.ai/owxf6

오픈소스 프로젝트인 "awesome-ai4s"는 100개가 넘는 AI4S 논문 해석을 모아 방대한 데이터 세트와 도구를 제공합니다.
https://github.com/hyperai/awesome-ai4s

데이터셋: 14,000개 물질의 화학성분 및 유형정보 추출

다양한 출처 자료를 포괄하는 포괄적인 데이터베이스를 구축하는 것이 연구의 핵심입니다.연구팀은 먼저 키워드를 활용해 시멘트 및 콘크리트 관련 학술논문 8만8000여 편 중 핵심문서 4312편을 선정했다.플라이 애시, 슬래그, 천연 화산암 등 19개 사전 정의된 범주를 포함하여 14,434개 물질의 화학적 구성 및 유형 정보가 추출되었으며, 여기에는 플라이 애시 샘플 2,028개와 슬래그 샘플 1,346개가 포함되었습니다. 이는 이전 연구에서 사용한 플라이 애시 샘플 725개와 슬래그 샘플 828개와 비교했을 때 데이터 크기가 상당히 확장된 것입니다.

반면, 모델을 학습하려면,연구자들은 R³ 표준 시험 방법의 실험 데이터를 통합했습니다.여기에는 318개 재료를 포함하는 1,330개 시료의 열 방출 데이터, 208개 시료의 Ca(OH)₂ 소비량 데이터, 그리고 292개 시료의 결합수 데이터가 포함되어 있습니다. 이는 현재 이용 가능한 시멘트 대체 실험 데이터 세트 중 가장 큰 규모입니다.
* R³ 표준 시험: 화학 조성, 중간 입자 크기, 비중, 혼합 비율 및 비정질/결정질 상 함량을 기반으로 하는 표준 화학 반응성 시험

연구진은 훈련된 모델을 세계 최대 규모의 암석 화학 성분 데이터베이스에 적용했습니다.이 데이터베이스에는 총 100만 개 이상의 암석 샘플이 포함되어 있습니다.이후 연구진은 모든 기록의 반응성을 평가하고 분류한 뒤, 문헌에 측정된 비정질 함량 데이터가 있는 약 160개의 암석 샘플과 결합하고, 데이터 보간 기술을 통해 비정질 함량과 같은 누락된 주요 특성을 수정하여 최종적으로 천연 및 2차 시멘트 재료의 반응성에 대한 통합 데이터베이스를 구축했습니다.

또한, 데이터 특징 구축 측면에서는 CaO, Al₂O₃, SiO₂ 등 주요 산화물의 함량을 추출하였으며, 이 중 총 80% 이상을 갖는 재료의 비중이 상대적으로 높았습니다. 동시에, 중간 입자 크기, 비중, 비정질 상 함량과 같은 물리적 매개변수와 경화 온도 및 경화 시간과 같은 공정 조건을 결합하여 318개 재료와 1,850개의 데이터 포인트를 포함하는 훈련 세트를 구축했습니다.

모델 아키텍처: 겔 반응성에 대한 다중 작업 신경망 예측

본 논문에서는 다중 헤드 신경망 아키텍처를 사용하여 시멘트 시스템의 재료 반응성을 예측합니다.이 아키텍처는 열 방출, Ca(OH)₂ 소모량, 결합수 등 여러 반응성 지표를 동시에 예측하도록 설계되었습니다. 멀티헤드 아키텍처의 장점은 교차 작업 전이 학습을 활용하여 기본 특성을 공유함으로써 개별 작업의 예측 정확도를 향상시킬 수 있다는 것입니다.

모델 입력에는 재료의 화학적 조성(예: CaO, Al₂O₃, SiO₂, Fe₂O₃, MgO 등), 입자 크기, 비정질 함량, 비중과 같은 주요 설명자가 포함됩니다. 이러한 설명자는 반응성 예측에 대한 기여도가 적절한지 확인하기 위해 SHAP 분석(Shapley Additive exPlanations)을 통해 검증됩니다. SHAP 분석 결과에 따르면 주요 산화물(예: CaO, Al₂O₃, SiO₂)이 반응성 예측을 위한 주요 설명자이며, 비정질 함량과 비중도 반응성에 상당한 영향을 미치는 것으로 나타났습니다.

여러 반응성 지표를 동시에 예측하고 누락된 값을 처리하는 과제를 해결하기 위해연구원들은 두 가지 방법을 사용하여 누락된 값을 관리하는 Imputation-aware 멀티태스크 신경망을 설계했습니다.출력단에는 사용자 지정 손실 함수가 설계되었으며, 손실은 누락되지 않은 값에 대해서만 계산됩니다. 입력단에서는 누락된 값을 보간하는 동시에 보간된 데이터를 표시하는 마스크를 생성하는 이중 방법을 개발하여 네트워크가 원래 값과 보간된 값을 구분할 수 있도록 합니다. 모델 아키텍처는 보간된 값을 처리하기 위해 연결을 통해 입력 설명자와 마스크를 통합합니다. 최적화된 네트워크 구조는 ReLU 활성화 함수를 포함하는 4개의 고밀도 레이어로 구성되며, 드롭아웃 레이어와 배치 정규화 레이어가 겹치면서 과적합을 완화합니다. 다양한 출력의 손실 가중치는 지표의 기여도를 균형 있게 조정하기 위해 사용 가능한 데이터 포인트 수에 반비례합니다. 마지막으로, Keras Tuner를 사용하여 하이퍼파라미터(옵티마이저, 학습률, 레이어 수 등)를 최적화하고, 학습 과정에서 조기 종료 전략을 채택합니다. 과적합을 방지하기 위해 손실을 모니터링하고 검증하여 최적의 모델 가중치를 복원합니다.

LLM 기반 재료 마이닝 및 반응성 연구 및 평가

실험 모델은 물리적인 실험실 시험 없이도 시멘트 시스템에서 재료의 반응성을 정확하게 예측할 수 있어 재료 발굴 및 선별 과정을 크게 가속화하고 시멘트 생산 과정에서 온실가스 배출을 줄이는 새로운 방법을 제시합니다. 또한, 이 연구는 클링커 사용량을 줄이는 데 있어 대체 재료의 잠재력을 확인했습니다. 비정질 함량을 증가시켜 재료의 반응성을 높이는 이러한 발견은 향후 재료 설계에 중요한 지침을 제공합니다.

LLM 기반 문헌 마이닝 및 전구체 분석

LLM 미세조정을 통해 추출된 화학성분은연구진은 CaO–Al₂O₃–SiO₂ 3원 도표를 그렸습니다.아래 그림에서 볼 수 있듯이, 총 TP3T 함량이 80중량% 이상인 시료 중 미립자와 소량의 시멘트를 제외한 대부분의 시료는 Al₂O₃ 함량이 낮고, CaO 함량이 높으며, SiO₂ 함량이 낮은 특징을 보입니다. 이 중 56%는 TP3T CaO 함량이 15~70중량%, 73%는 TP3T SiO₂ 함량이 15~70중량%, 그리고 70.5%는 TP3T 함량이 15중량% 미만인 Al₂O₃를 함유하고 있습니다. 시료의 약 94.5%는 TP3T 함량이 0~15중량%인 Fe₂O₃를 함유하고 있으며, 95%는 TP3T 함량이 10중량% 미만인 MgO를 함유하고 있습니다.연구진은 이전 연구와 비교해서 플라이애시 샘플 2,028개와 슬래그 샘플 1,346개를 추가했습니다.동시에 천연 화산재, 바이오매스재, 광미 등 새로운 물질 유형도 포함되었습니다. 즉, 이전 연구에서는 7,490개의 물질을 11개 범주로 분류했지만, 본 연구에서는 12,898개의 물질과 19개 범주로 확대했습니다.

(CaO-Al₂O₃-SiO₂ > 80%wt) CaO-Al₂O₃-SiO₂ 삼원 도표

또 다른 LLM은 저널 데이터를 기반으로 재료 유형 및 하위 유형(예: 광미 내 구리 광미)을 식별하고, 더욱 정교한 분류 분석을 위해 재료를 19개의 사전 정의된 유형 및 하위 유형으로 분류했습니다. 화학 조성은 재료 유형을 식별하는 데 도움이 되지만, 재료의 반응성을 직접적으로 나타낼 수는 없습니다. 시멘트 전구체의 조성 변화를 탐구하기 위해 연구진은 아래 그림과 같이 CaO, Al₂O₃, SiO₂의 총 함량이 80 wt%를 초과하는 시료에 대해 t-SNE 차원 감소 분석을 수행했습니다.결과에 따르면, 폐기물, 바이오매스 재, 유리를 제외한 대부분의 물질은 별도로 클러스터링되어 있으며, 시멘트는 불활성 석회와 명확하게 분리되지 않습니다.이는 화학적 조성에만 근거하여 반응성을 예측하는 데 한계가 있음을 나타냅니다.

잠재적인 시멘트 전구체(CaO + Al₂O₃ + SiO₂ > 80% wt)의 t-SNE 플롯

머신러닝 모델 구축 및 반응형 예측

연구진은 기계 학습을 통해 재료 반응성을 예측하기 위해 R³ 테스트에서 얻은 세 가지 반응성 지표인 열 방출, Ca(OH)₂ 소모량, 결합수분 함량을 훈련에 사용했습니다.연구 결과, 열 방출은 결합된 물과 선형적으로 관련이 있는 것으로 나타났습니다.따라서 결합수를 이용하여 열 방출량을 추정하여 다각도 반응성 평가를 수행할 수 있습니다. 또한, SVM, 랜덤 포레스트, XGBoost, 단일 헤드 신경망과 비교했을 때, 이 모델은 세 가지 지표 모두에서 더 우수한 성능을 보였습니다. 열 방출량 RMSE는 28.20 J/g(신뢰구간 3.88 J/g), Ca(OH)₂ 소비량은 12.17 g/100g(±4.25), 결합수는 1.47 g/100g(±0.45), 예측 R²는 0.85 이상이었습니다.

이 모델은 순열 특징 중요도 분석과 SHAP 해석을 통해 주요 결정 요인을 밝혀냅니다.아래 그림과 같이, 주요 산화물(CaO, Al₂O₃, SiO₂, Fe₂O₃, MgO), 비정질 함량, 그리고 비중은 모두 반응성에 상당한 영향을 미칩니다. 그중 Al₂O₃와 CaCO₃는 열 방출과 결합수에 가장 중요한 역할을 하며, 이는 열 방출과 알루미네이트/에트링가이트 형성을 촉진하고 초기 강도를 향상시킬 수 있음을 시사합니다.CaO의 증가는 Ca(OH)₂의 소모를 줄이는데, 이는 CaO가 직접적인 칼슘 공급원을 제공하기 때문이다.비중이 낮은 재료는 수화 반응 부위가 더 많습니다. SHAP 분석 결과, 재료의 수화 연령이 증가함에 따라 비정질 구조의 비율이 높을 때 반응성이 증가함을 보여줍니다. 이러한 결과는 알려진 광물 활동도 법칙과 일치할 뿐만 아니라, 고성능 시멘트 재료를 선별하기 위한 머신 러닝 활용을 위한 해석 가능하고 3가지 지표를 이용한 예측 기술 기반을 제공합니다.


상위 10개 기여 설명자
(회색 막대는 화학적 특성을 나타내고, 노란색 막대는 환경적 특성을 나타내고, 연한 파란색 막대는 물리적 특성을 나타내고, 빨간색 막대는 페이스트 혼합물에 첨가된 물질의 혼합 비율을 나타냅니다)

2차 물질의 반응성 평가 및 활용 가능성

모델 프레임워크는 비정질 함량, 비중 및 중간 입자 크기와 같은 설명자를 추정하기 위한 화학적 구성 및 보간 방법을 기반으로 다양한 2차 물질의 반응성을 정량적으로 평가합니다.

연구진은 열 방출과 Ca(OH)₂ 소모 측면에서 재료의 반응성을 매핑하여 포졸란 재료(Ca(OH)₂ 소모 > 50g/100g), 불활성 재료(열 방출 < 100J/g) 및 유압 경도를 나타내는 슬래그를 명확히 구분했습니다.일반적으로 플라이애시, 천연 포졸란, 실리카흄, 특정 점토, 유리 및 미사 폐기물은 모두 포졸란 특성을 나타내는 반면, 칼슘이 함유된 폐기물은 거의 반응성이 없습니다.슬래그 기반 재료는 반응성은 낮지만 일반적으로 수력학적으로 거동합니다. 반면 바이오매스 재, 건설 폐기물 및 바닥재도 포졸란 시멘트 재료로 잠재력이 있는 것으로 나타나 이 모델이 이전 연구와 일치함을 입증합니다.

각 재료의 클링커 대체 가능성을 정확하게 평가하기 위해이 연구에서는 원료를 출처와 가공 방법에 따라 하위 유형으로 세분화하고, 고유한 반응 특성을 분석했습니다.아래 그림에서 보듯이, 결과는 다음과 같습니다. F형 플라이애시의 화산재 활동은 C형보다 강합니다. 슬래그와 바이오매스 재의 반응 성능은 다양한 출처로 인해 상당한 차이가 있습니다. 건설 및 철거 폐기물의 재활용 세라믹, 벽돌, 콘크리트는 모두 상당한 화산재 특성을 보이며, 그 중 폐 세라믹의 열 방출 값은 450J/g로 높습니다. 구리와 아연 찌꺼기의 열 방출은 400J/g에 도달할 수 있어 혼합 광물도 잠재력이 있음을 보여줍니다.

석탄 비산재, 슬래그, 바이오매스 재, 건설 및 철거 폐기물 및 폐유리, 기타 재 및 광산 잔여물 + 정유소 잔류물(보크사이트 잔류물) 등 재료 하위 유형의 추가 변형

공급 분석에 따르면 플라이애시, 슬래그 및 바이오매스가 함께 전 세계 시멘트 생산량의 53%(각각 19%, 12% 및 22%)를 대체할 수 있지만,이 연구는 또한 건설 및 철거 폐기물과 도시 고형 폐기물이 대부분 국가에서 클링커를 상당 부분 대체할 수 있으며, 각각 약 55%와 13%를 대체할 수 있다고 지적했습니다.대체 잠재력은 훨씬 더 크며, 이 두 물질은 전 세계 시멘트 생산량의 68%를 대체할 수 있습니다. 일부 물질은 자연적으로 반응성이 없지만, 건설 및 도시 고형 폐기물은 확장 가능한 특정 활성화 공정을 통해 여전히 상당한 클링커 대체 잠재력을 보여줍니다. 예를 들어, 전기 아크로 처리법은 재활용 콘크리트에서 시멘트 페이스트를 재숙성시키며, 목재 폐기물 및 기타 폐기물의 공동 열분해는 바이오차를 중간 정도의 반응성을 가진 포졸란 물질로 전환할 수 있습니다.

천연 젤 전구체의 세계적 발견

연구진은 보간 모델을 사용하여 R³ 데이터세트의 화학 조성 및 비정질 데이터를 입력함으로써 반응성 예측의 정확도를 크게 향상시켰습니다. 그 결과, 비정질 함량에 대한 모델의 평균 보간 오차는 3.0%에 불과했으며, 이에 상응하는 반응성 예측 오차는 5.0%였습니다.

예측 모델을 사용하여 암석 반응성을 평가한 결과, 열 방출량이 200J/g를 넘는 1,200개 이상의 암석 유형을 연구하고 50,569개의 천연 전구체를 확인했습니다.그중 25개 암석 유형의 반응성 전구체는 5%를 초과합니다. 사장석과 이그님브라이트의 반응성은 전체 시료의 약 25%에 비해 가장 높습니다.다음은 반암, 쇄설성 암, 그리고 규질 응회암입니다. 유문암과 같은 분출 화산암의 총 부피 대비 반응성 비율은 12%보다 낮지만, 전 세계적으로 분포가 넓어 반응성이 더 높은 시료가 존재합니다. 확인된 반응성 시료의 대부분은 화산재 범위에 속하며, 약 46,700개의 시료가 화산재에 속하고 약 3,800개의 시료가 수리경도에 속합니다. 암석 종류에 따라 높은 반응성 잠재력에 차이가 있습니다.확인된 천연 전구물질은 전 세계에 분포하며, 특히 지진대와 같은 지역에 집중되어 있습니다. 중간 및 고활성 전구물질은 클링커 원료의 대체재로 사용될 수 있습니다.현재 자료에 따르면 선구 물질은 주로 캐나다, 미국 및 기타 국가에 분포하지만, 실제로는 전 세계에 걸쳐 발견됩니다. 화산 선구 물질은 북유럽, 아시아 및 기타 지역에 집중되어 있습니다. 북미에서는 아래 그림과 같이 주로 애팔래치아 산맥 및 기타 지역에 분포합니다.

전 세계적으로 테프라와 수력학적 거동을 갖는 식별된 반응성 암석의 지리공간적 분포
북미 전역에서 발견된 테프라와 수력학적 거동을 지닌 반응성 암석의 지공간적 분포

데이터 기반 저탄소 지능형 시멘트 시대

실제로 학술 연구 분야에서 AI 기술은 시멘트 및 콘크리트 산업 체인의 모든 연결 고리에 파괴적인 방식으로 침투하고 있으며 성능 예측 및 생산 최적화 측면에서 다차원적인 혁신을 달성했습니다.

예를 들어,홍콩 이공대학 전자컴퓨팅학과의 웨이샤오용 교수와 그의 팀은 시멘트 재료에 이산화탄소를 효과적으로 저장할 수 있는 머신 러닝 방법을 제안했습니다.의사결정 트리, 랜덤 포레스트, 그리고 익스트림 그래디언트 부스팅(XGBoost)의 세 가지 고급 머신러닝 기법을 사용하여 기존 데이터셋과 문헌에서 수집된 데이터를 결합했습니다. XGBoost 모델의 성능이 기존 선형 회귀 분석법보다 훨씬 우수함을 검증했습니다. 또한, SHAP을 활용하여 널리 알려진 요인들 외에도 시멘트 종류를 연구하여 탄산화 깊이에 미치는 주요 영향을 입증했습니다. CEM II/B-LL과 CEM II/BM은 탄산화 가능성이 더 높은 두 가지 유형입니다. 이 결과는 시멘트 CO2 포집에 영향을 미치는 주요 요인을 파악하고 실험 설계 최적화를 위한 통찰력을 제공합니다. 관련 결과는 네이처(Nature) 제휴 저널에 "시멘트 재료에서 효율적인 CO2 포집을 위한 머신러닝: 데이터 기반 방법"이라는 제목으로 게재되었습니다.

서류 주소:
https://www.nature.com/articles/s44296-025-00053-z

초고성능 콘크리트(UHPC)의 높은 비용에 직면하여,미주리 과학기술대학교 재료과학 및 공학과의 연구팀은 머신 러닝을 사용하여 UHPC 혼합물의 성능을 최적화하고 예측하여 효율성을 크게 개선하고 개발 시간을 단축했습니다.결과는 랜덤 포레스트(RF) 모델이 인공 신경망(ANN) 모델보다 압축 강도 예측에 더 우수함을 보여줍니다. SHAP 값 분석 결과, 연령, 섬유 함량, 혼화재(SCM) 함량이 유의미한 영향을 미치며, SCM의 화학 조성은 덜 중요함을 보여줍니다. 화학 조성을 제거한 후, 선택된 입력 변수만 사용한 예측 효율은 전체 입력 변수 집합의 예측 효율과 동일합니다. UHPC 성능을 정확하게 예측하기 위해서는 기본적인 혼합 설계 정보만 필요하며, 이는 데이터 수집량을 줄일 뿐만 아니라 계산 메모리 사용량과 처리 시간도 단축합니다.

서류 주소:
https://www.nature.com/articles/s41598-025-94484-2

미래를 내다보면, 시멘트 재료 분야에서 고처리량 모델과 신경망을 통합한 AI가 시멘트 산업이 2050년까지 탄소 중립 목표를 달성하는 핵심 동력이 될 수 있습니다. 신소재 혁명의 중요한 시점에 서 있는 이 AI는 "이중 탄소" 목표 달성을 위한 인프라 건설을 위한 새로운 지능적이고 친환경적인 길을 열어줄 것입니다.

참조 링크:
1.https://mp.weixin.qq.com/s/4Nmf7aMkuRo8-eietH7bNw
2.https://mp.weixin.qq.com/s/f9D6tVDsruhUr7YbZ7zlhA
3.https://mp.weixin.qq.com/s/3q696f2qqU8Wk949qgivbw