MITチームは大規模モデルを使用して、25種類のセメントクリンカー代替材料をスクリーニングしました。これは、温室効果ガス排出量を12億トン削減することと同等です。

セメント生産は、世界的に温室効果ガス(GHG)排出の主要な発生源の一つであり、世界の人為的GHG排出量の6%以上を占めています。この環境負荷は主に、セメントクリンカーの製造プロセスに起因しています。このプロセスでは、石灰石を高温(>950°C)で焼成する化学反応(CaCO₃→CaO+CO₂)と大量のエネルギー消費が伴います。世界的なインフラ需要の増大と人口増加に伴い、セメントクリンカーの生産量は増加しています。MITチームの論文によると、セメント生産量は2050年までにさらに20%増加すると予想されており、環境への圧力はさらに悪化するだろう。
従来のセメントクリンカーの代替戦略は、主にフライアッシュ(石炭燃焼の副産物)と高炉粒状スラグ(鉄鋼生産の副産物)に依存しており、機械的特性を維持しながら最大 50% のクリンカー質量を代替できるため、理論的には GHG 強度を 50% 削減できます。しかし、過去20年間、石炭エネルギー生産の減少と鉄鋼リサイクルの増加により、セメント総生産量に占めるその供給量は25%から17%に減少しました。バイオマス灰、廃ガラス粉末、都市ごみ焼却灰などの新興代替材料は有望性を有していますが、反応性の不安定さや供給量の季節変動などの課題があり、より持続可能で安定した代替材料の開発が急務となっています。
マサチューセッツ工科大学(MIT)のSoroush Mahjoubi氏、Elsa A. Olivetti氏らは、より実現可能な代替材料を体系的に特定するために、革新的なマルチソースデータ統合手法を提案しました。この手法は、大規模言語モデル(LLM)に基づき、88,000件の論文から14,000種類の材料の化学組成を抽出し、マルチヘッドニューラルネットワークを用いて材料の反応活性(発熱、水酸化カルシウム(Ca(OH)₂)の消費量、結合水)を予測し、統一的な活性評価フレームワークを構築します。初めて、世界中で 50,000 種類を超える天然および産業副産物材料の反応性が特定され、数値化され、セメントクリンカーの代替となる可能性のある 25 種類の天然岩石が選定されました。研究では、建設解体廃棄物、焼却灰、火山岩などの天然素材は反応性が高く、世界のクリンカー使用量の約50%を代替することができ、これは温室効果ガス排出量を12億トン削減することに相当することが判明しました。
関連研究は、「二次および天然セメント質前駆体のデータ駆動型材料スクリーニング」というタイトルでCommunication Materialsに掲載されました。
研究のハイライト
* 代替材料のセメント反応性を均一に評価するために、LLMとニューラルネットワークを統合したマルチスケール反応性モデリングフレームワークを提案した。
* 従来の実験スクリーニングの限界を打ち破り、14,000種類の材料と1,200種類以上の岩石を網羅した世界最大のセメント代替材料データベースを構築します。
* 25種類の天然岩石が反応性が高いことが判明し、世界のセメント産業における炭素排出量を大幅に削減できる地域的なクリンカー代替戦略を支援

用紙のアドレス:
AIフロンティアに関するその他の論文:
https://go.hyper.ai/owxf6
オープンソース プロジェクト「awesome-ai4s」は、100 を超える AI4S 論文の解釈をまとめ、大規模なデータ セットとツールを提供します。
https://github.com/hyperai/awesome-ai4s
データセット: 14,000種類の物質の化学組成と種類情報の抽出
複数のソース資料を網羅した包括的なデータベースを構築することが研究の鍵となります。まず研究チームは、セメントとコンクリートに関連する88,000件の学術論文からキーワードを使って4,312件のコア文書を選定した。フライアッシュ、スラグ、天然火山岩など、19 の定義済みカテゴリをカバーする 14,434 個の物質の化学組成と種類情報が抽出されました。これには、2,028 個のフライアッシュ サンプルと 1,346 個のスラグ サンプルが含まれており、これは以前の研究の 725 個のフライアッシュ サンプルと 828 個のスラグ サンプルと比較するとデータ サイズが大幅に拡大しています。
一方、モデルを訓練するには、研究者らは、R³標準試験方法からの実験データを統合した。このデータセットには、1,330サンプルの発熱データ、208サンプルのCa(OH)₂消費データ、292サンプルの結合水データが含まれており、318種類の材料を網羅しています。これは、現在入手可能なセメント代替材料に関する実験データセットとしては最大級のものです。
* R³標準試験:化学組成、平均粒子サイズ、比重、混合比、非晶質/結晶相含有量に基づく標準的な化学反応性試験
研究者らは、訓練したモデルを世界最大の岩石化学組成データベースに適用した。データベースには合計 100 万個を超える岩石サンプルが含まれています。その後、研究者らはすべての記録の反応性を採点・分類し、文献に記載されている非晶質含有量測定データを持つ約160個の岩石サンプルと組み合わせ、データ補間技術を通じて非晶質含有量などの欠落している重要な特性を修正し、最終的に天然および二次起源のセメント質材料の反応性の統一データベースを構築しました。
さらに、データ特徴構築の観点から、本研究ではCaO、Al₂O₃、SiO₂などの主要な酸化物の含有量を抽出しました。その中で、総含有量が80%を超える材料が比較的高い割合を占めていました。同時に、平均粒子径、比重、非晶質相含有量などの物理的パラメータ、および硬化温度や年齢などのプロセス条件と組み合わせることで、318種類の材料と1,850個のデータポイントを含むトレーニングセットを構築しました。
モデルアーキテクチャ: ゲル反応性のマルチタスクニューラルネットワーク予測
この論文では、マルチヘッドニューラルネットワークアーキテクチャを使用して、セメントシステム内の材料の反応性を予測します。このアーキテクチャは、発熱、Ca(OH)₂消費量、結合水といった複数の反応性指標を同時に予測するように設計されています。マルチヘッドアーキテクチャの利点は、タスク間転移学習を活用し、基盤となる特徴を共有することで個々のタスクの予測精度を向上させることができることです。
モデルへの入力には、物質の化学組成(例:CaO、Al₂O₃、SiO₂、Fe₂O₃、MgOなど)、粒子径、非晶質含有量、比重といった主要な記述子が含まれます。これらの記述子は、SHAP分析(Shapley Additive exPlanations)を用いて検証され、反応性予測への寄与が妥当であることが確認されています。 SHAP 分析結果によると、主要な酸化物 (CaO、Al₂O₃、SiO₂ など) が反応性予測の上位の記述子であり、非晶質含有量と比重も反応性に大きな影響を与えます。
複数の反応性指標を同時に予測し、欠損値を処理するという課題に対処するために、研究者らは、2つの方法を使用して欠損値を管理する、補完を考慮したマルチタスクニューラルネットワークを設計しました。出力端ではカスタム損失関数が設計され、損失は欠損値でない値のみに基づいて計算されます。入力端では、欠損値を補間すると同時に補間データをマークするマスクを作成するデュアルメソッドが開発され、ネットワークが元の値と補間値を区別できるようになります。モデルアーキテクチャは、入力記述子とそのマスクを接続を介して統合し、補間値を処理します。最適化されたネットワーク構造には、ReLU活性化関数を備えた4つの密層が含まれており、ドロップアウト層とバッチ正規化層が点在して、過剰適合を軽減します。異なる出力の損失重みは、指標が寄与をバランスさせるために利用可能なデータポイントの数に反比例します。最後に、Keras Tunerを使用してハイパーパラメータ(オプティマイザー、学習率、層数など)を最適化し、トレーニングでは早期停止戦略を採用します。損失を監視および検証することにより、最適なモデルの重みが復元され、過剰適合を回避します。
LLMベースの材料採掘と反応性の研究と評価
この実験モデルは、物理的な実験室試験を必要とせずにセメント系における材料の反応性を正確に予測できるため、材料の発見とスクリーニングのプロセスを大幅に加速し、セメント製造における温室効果ガス排出量を削減する新たな方法を提供します。さらに、この研究は、クリンカー使用量の削減において代替材料が持つ可能性を確認しました。非晶質含有量の増加によって材料の反応性が向上するというこの発見は、将来の材料設計にとって重要な指針となります。
LLMに基づく文献マイニングと先行研究分析
LLMを微調整して抽出した化学成分は、研究者らはCaO-Al₂O₃-SiO₂の三元系図を描いた。下図に示すように、尾鉱と少量のセメントを除く、総含有量が80 wt%TP3Tを超えるサンプルのほとんどは、Al₂O₃が低く、CaOが高く、SiO₂が低いという特徴があります。そのうち、56%は15~70 wt%TP3TのCaOを含み、73%は15~70 wt%TP3TのSiO₂を含み、70.5%は15 wt%TP3T未満のAl₂O₃を含みます。サンプルの約94.5%は0~15 wt%TP3TのFe₂O₃を含み、95%は10 wt%TP3T未満のMgOを含みます。研究者らは、以前の研究と比較して、フライアッシュサンプル2,028個とスラグサンプル1,346個を追加した。同時に、天然火山灰、バイオマス灰、尾鉱といった新たな物質の種類も追加されました。つまり、前回の研究では7,490種類の物質を11のカテゴリーに分類していましたが、本研究では12,898種類の物質を19のカテゴリーに拡大しました。

別の法学修士課程では、ジャーナルデータに基づいて物質の種類とサブタイプ(例えば、尾鉱中の銅尾鉱など)を特定し、より精緻な分類分析のために、19の定義済みの種類とサブタイプに分類しました。化学組成は物質の種類を特定するのに役立ちますが、物質の反応性を直接明らかにすることはできません。セメント系前駆体の組成変化を調べるため、研究者らは、CaO、Al₂O₃、SiO₂の総含有量が80 wt%TP3Tを超えるサンプルに対してt-SNE次元縮減分析を実施しました(下図参照)。結果によると、尾鉱、バイオマス灰、ガラスを除いて、ほとんどの物質は別々に集まっているように見え、セメントは不活性石灰から明確に分離されていないことがわかりました。これは、化学組成のみに基づいて反応性を予測することには限界があることを示しています。

機械学習モデルの構築と反応予測
機械学習による材料の反応性の予測に関しては、研究者らはR³テストから得られた3つの反応性指標、すなわち発熱、Ca(OH)₂消費量、結合水含有量をトレーニングに使用しました。研究では、熱の放出は結合水と直線関係にあることが判明した。したがって、結合水を用いて熱発生量を推定することで、多角的な反応性評価が可能になります。さらに、サポートベクターマシン、ランダムフォレスト、XGBoost、シングルヘッドニューラルネットワークと比較したところ、本モデルは3つの指標すべてにおいて優れた性能を示しました。熱発生量のRMSEは28.20 J/g(信頼区間3.88 J/g)、Ca(OH)₂消費量は12.17 g/100g(±4.25)、結合水量は1.47 g/100g(±0.45)、予測R²は0.85以上でした。
このモデルは、順列特徴重要度分析と SHAP 解釈を通じて重要な決定要因を明らかにします。下図に示すように、主要な酸化物(CaO、Al₂O₃、SiO₂、Fe₂O₃、MgO)、非晶質含有量、および比重はいずれも反応性に大きく影響します。中でも、Al₂O₃とCaCO₃は放熱と結合水に最も重要であり、放熱とアルミン酸塩/エトリンガイトの形成を促進し、初期強度を向上させることが示唆されています。CaO の増加は直接的なカルシウム源となるため、Ca(OH)₂ の消費量を減らします。低比重材料は水和反応サイトが多く存在します。SHAP分析では、材料の水和年齢が増加するにつれて、非晶質構造の割合が高い場合の反応性が高まることも示されています。これらの結果は、既知の鉱物活性則と整合しているだけでなく、機械学習を用いて高性能セメント系材料をスクリーニングするための、解釈可能な3指標予測の技術的根拠も提供します。



(灰色のバーは化学的性質、黄色のバーは環境記述子、水色のバーは物理的性質、赤色のバーはペースト混合物に添加された材料の混合比を表す)
二次材料の反応性評価と利用可能性
モデルフレームワークは、化学組成と補間法に基づいてさまざまな二次材料の反応性を定量的に評価し、非晶質含有量、比重、平均粒子サイズなどの記述子を推定します。
研究者らは、熱放出とCa(OH)₂消費の観点から材料の反応性をマッピングし、ポゾラン材料(Ca(OH)₂消費量 > 50g/100g)、不活性材料(熱放出 < 100J/g)、および水硬性を示すスラグを明確に区別しました。一般に、フライアッシュ、天然ポゾラン、シリカフューム、特定の粘土、ガラス、尾鉱はすべてポゾラン特性を示しますが、カルシウム含有廃棄物はほとんど反応しません。スラグベースの材料は、反応性が低いものの、通常は水硬性を示します。一方、バイオマス灰、建設廃棄物、ボトムアッシュもポゾランセメント質材料としての可能性を示しており、モデルが以前の研究と一致することが検証されています。
各材料のクリンカー代替可能性を正確に評価するために、この研究では、原料や加工方法に基づいて材料をさらにサブタイプに分類し、それぞれの固有の反応特性を分析しました。下図に示すように、結果から、F 型フライアッシュの火山灰活性は C 型よりも強いことがわかります。スラグとバイオマス灰の反応性能は、その発生源の多様性により大きく異なります。建設廃棄物および解体廃棄物に含まれるリサイクルされたセラミック、レンガ、コンクリートはすべて、顕著な火山灰特性を示しており、その中でも、廃セラミックの熱放出値は 450 J/g と高く、銅と亜鉛の尾鉱の熱放出は 400 J/g に達することがあり、混合鉱物にも可能性があることを示しています。

供給分析によると、フライアッシュ、スラグ、バイオマスは合計で世界のセメント生産量の53%(それぞれ19%、12%、22%)を代替できるものの、さらにこの研究では、ほとんどの国で建設廃棄物と解体廃棄物、および都市固形廃棄物も、それぞれ約55%と13%のクリンカーを代替できると指摘している。代替の可能性はさらに大きく、これら2つで世界のセメント生産量の68%を代替できる可能性があります。一部の物質は自然に反応しないものもありますが、建設廃棄物や都市固形廃棄物は、拡張可能な特異的活性化プロセスを通じて、依然としてクリンカーの代替として大きな可能性を秘めています。例えば、電気炉処理法は、リサイクルコンクリート中のセメントペーストを再熟成させます。また、木材廃棄物やその他の廃棄物の共熱分解により、バイオチャールを中程度の反応性を持つポゾラン材料に変換できます。
天然ゲル前駆体の世界的な発見
研究者らは、R³データセットから化学組成と非晶質データを入力するために補間モデルを用いることで、反応性予測の精度を大幅に向上させました。その結果、非晶質含有量に関するモデルの平均補間誤差はわずか3.0%であり、対応する反応性予測誤差は5.0%であることが示されました。
岩石の反応性を評価する予測モデルを使用して、熱放出が 200 J/g を超える 1,200 種類以上の岩石を調査し、50,569 個の天然前駆物質を特定しました。そのうち、25種類の岩石の反応性前駆物質は5%を超えています。灰長石とイグニンブライトの反応性は、サンプル全体と比較して最も高く、約25%です。次に斑岩、砕屑岩、珪質凝灰岩が続く。流紋岩などの噴出性火山岩の反応性は12%よりも低いものの、地球全体に広く分布しているため、反応性の高い試料が多く存在する。確認された反応性試料のほとんどは火山灰域に属し、約46,700試料が火山灰、約3,800試料が水硬性岩に属している。岩石の種類によって、高い反応性を示す可能性には差がある。特定された天然前駆体は世界中に分布しており、地震帯などの地域に集中しています。中程度および高活性の前駆体は、クリンカー原料の代替品として使用できます。現在のデータでは、前駆岩は主にカナダ、アメリカ合衆国などの国々に分布しているように見えますが、実際には世界中に存在しています。火山性前駆岩は北欧、アジアなどの地域に集中しており、北米では主にアパラチア山脈などの地域に分布しています(下図参照)。


データ駆動型低炭素インテリジェントセメント時代
実際、学術研究の分野では、AI 技術が破壊的な方法でセメントおよびコンクリート産業チェーンのすべてのリンクに浸透し、パフォーマンス予測と生産最適化において多面的なブレークスルーを達成しています。
例えば、香港理工大学電子計算学部の魏暁勇教授と彼のチームは、セメント材料に二酸化炭素を効果的に貯蔵できる機械学習法を提案した。既存のデータセットと文献から収集したデータを統合するために、3つの高度な機械学習手法、決定木、ランダムフォレスト、そしてエクストリーム勾配ブースティング(XGBoost)が用いられました。XGBoostモデルの性能は、従来の線形回帰法よりも大幅に優れていることが検証されました。さらに、SHAPを用いて、広く認識されている要因に加えて、セメントの種類も研究され、炭酸化深度に影響を与える重要な役割が実証されました。CEM II/B-LLとCEM II/BMは、炭酸化ポテンシャルが高い2つの種類です。この結果により、セメントのCO2隔離に影響を与える主要な要因を特定し、実験設計を最適化するための知見を得ることができました。関連結果は、「セメント系材料への効率的なCO2隔離のための機械学習:データ駆動型手法」というタイトルでNatureの提携ジャーナルに掲載されました。
用紙のアドレス:
https://www.nature.com/articles/s44296-025-00053-z
超高性能コンクリート(UHPC)の高コストに直面して、ミズーリ科学技術大学の材料科学工学部の研究チームは、機械学習を使用して UHPC 混合物の性能を最適化および予測し、効率を大幅に向上させ、開発時間を短縮しました。結果は、ランダムフォレスト(RF)モデルが人工ニューラルネットワーク(ANN)モデルよりも圧縮強度の予測に優れていることを示しています。SHAP値分析では、樹齢、繊維含有量、混和材(SCM)含有量が大きな影響を与え、SCMの化学組成はそれほど重要ではないことが示されています。化学組成を除外すると、選択された入力変数のみの予測効率は、すべての入力変数の予測効率と同等になります。UHPCの性能を正確に予測するには、基本的な配合設計情報のみが必要であることがわかります。これにより、データ収集量が削減されるだけでなく、計算メモリの使用量と処理時間も削減されます。
用紙のアドレス:
https://www.nature.com/articles/s41598-025-94484-2
将来を見据えると、セメント材料分野におけるハイスループットモデルとニューラルネットワークを統合したAIは、セメント業界が2050年までにカーボンニュートラルの目標に向かって前進するための中核的な原動力となる可能性がある。新材料革命の重要な局面に立つAIは、「デュアルカーボン」目標の下でのインフラ建設のための新たなインテリジェントでグリーンな道を切り開くだろう。
参考リンク:
1.https://mp.weixin.qq.com/s/4Nmf7aMkuRo8-eietH7bNw
2.https://mp.weixin.qq.com/s/f9D6tVDsruhUr7YbZ7zlhA
3.https://mp.weixin.qq.com/s/3q696f2qqU8Wk949qgivbw