Command Palette
Search for a command to run...
MIT と他の研究者は、20,000 種類を超える配合に基づいて拡散モデルを使用して材料合成を計画し、シリコンとアルミニウムの比率が 19 にも達する新しいゼオライト材料の開発に成功しました。

化学、物理学、工学が深く絡み合う最先端分野である材料合成は、常に現代の技術革新の中核を担ってきました。しかし、新素材の誕生は、定められた処方を単純に実現することではなく、科学的直感、精密な制御、そして粘り強い探求を融合させた不確実な創造です。このプロセスを料理に例えると、同じ料理でも、調理人、材料の配合、加工技術、そしてわずかな火加減の違いが、最終的な味を大きく左右します。材料合成においても同様です。パラメータの選択や条件の微調整は、材料の特性に大きな、さらには決定的な影響を与え、異なる結果をもたらす可能性があります。
現在、研究者たちはハイスループットコンピューティングとデータ駆動型手法を用いて、膨大な数の化合物から、潜在的な安定性と合成可能性を持つ数百万種の材料をスクリーニングしています。これは、数え切れないほどの珍味や絶品料理を網羅した「メニュー」のようなもので、材料合成分野における「何を合成するか」という根本的な問いに対する暫定的な答えを提供しています。しかし、料理がレシピだけでなく準備プロセスにも依存するように、「メニュー」だけが提示され、実現可能な「調理方法」が提示されていないことは、材料合成における依然として大きなボトルネックとなっています。したがって、理論上の材料をどのように「調理する」か、つまり「どのように合成するか」という問題を解決することは、現在の材料研究が実用化に向けて克服しなければならない重要なハードルとなっています。
上記の課題に対応して、MIT、ミュンヘン工科大学、バレンシア工科大学の研究チームが、DiffSynと呼ばれる生成拡散モデルを革新的に提案しました。このモデルは、50年以上にわたる文献から23,000以上の生成式を学習しており、標的のゼオライト構造と有機テンプレートに基づいて、可能な合成経路を生成することができます。その主な利点は、材料における構造と合成の関係における「1対多」および「マルチモーダル」な特性を捉え、研究者に材料調製プロセスに関する科学的かつ正確なガイダンスを提供することにあります。回帰モデルやその他の生成モデルを用いた従来の手法と比較して、DiffSynは大幅に優れた性能を発揮します。
研究中、研究チームは、ゼオライト(触媒、吸着、イオン交換に幅広く使用できる結晶性微多孔材料の一種)の効率的な合成経路を予測する DiffSyn の能力を実証しました。研究チームは、合成経路に基づき、UFI型ゼオライト材料の調製に成功しました。密度汎関数理論による結合エネルギー計算により、誘導結合プラズマ発光分光分析(ICP)で測定したシリコン対アルミニウム比(Si/Al)が19.0に達することが確認されました。この優れた特性により多孔質材料の熱安定性が大幅に向上し、高温や過酷な環境での応用の基盤が築かれることが期待されます。
「DiffSyn: 材料合成計画への生成的拡散アプローチ」と題された関連研究成果が Nature Computational Science に掲載されました。
研究のハイライト:
* 50 年以上の文献から 23,961 の合成レシピに基づいてトレーニングされた DiffSyn は、従来の回帰モデルにおける決定論的マッピングの制限を克服します。
* 回帰モデルやその他の深層生成モデルと比較すると、DiffSyn は 12 個の合成パラメータのうち 10 個で最も低い平均絶対誤差を達成し、大きな優位性を示しています。
* シリコンとアルミニウムの比率が 19.0 という高いターゲット材料の作成に成功し、DiffSyn モデルの実用的価値を実証しました。

用紙のアドレス:
https://www.nature.com/articles/s43588-025-00949-9
弊社の公式 WeChat アカウントをフォローし、バックグラウンドで「ゼオライト予測」と返信すると、完全な PDF を入手できます。
ゼオライト合成に焦点を当てています。50 年にわたるトレーニング データで、23,000 種類以上の配合をカバーしています。
材料合成分野における深遠かつ成功した研究成果であるDiffSynの最大の特徴は、その焦点にあります。DiffSynモデルの学習に使用されるコアデータセットは、ZeoSynデータセットです。これは同じチームによって提案されたデータセットであり、233 のゼオライトトポロジーと 921 の有機構造指向剤 (OSDA) を含む、ゼオライトの水熱合成ルート 23,961 件をカバーしています。データソースは、50 年以上にわたるゼオライト合成に関する文献です。
モデル機能の強化: 生成拡散モデルに基づいて、革新的な化学ガイダンスが導入されます。
物質合成の道筋は決して唯一無二ではありません。本研究の筆頭著者であるエルトン・パン氏が述べたように、現実には物質の構造と合成の関係には異なる合成経路が存在する可能性があります。このパラダイムシフトは、構造と合成の関係を「1対1」から「1対多」へと変化させることを必要とします。
ベースモデルの選択 – 生成拡散モデル
機械学習手法にとって、構造と合成の「1対多」の関係は大きな課題となります。研究者は、その逆の関係、すなわち合成と構造の「1対多」の関係も考慮する必要があります。同様に、単一の処方が、熱力学や速度論といった複雑な要因の相互作用により、複数の生成物、すなわち競合相を形成する可能性があります。さらに、合成パラメータ間には複雑な非線形相互作用が存在するため、変数間の関係性を捉え、合成パラメータを評価するためには、複数の合成パラメータの確率を統合的にモデル化できる手法が必要です。
DiffSyn以前の従来の機械学習ベースの手法では、主に回帰モデルが用いられていました。これらの手法は、物質の特定の表現を合成パラメータに決定論的にマッピングし、構造と合成の1対1の関係を直接的に導き出していました。さらに重要なのは、合成パラメータ間の関係が独立しており、それらの間の強い結合を表現できなかったことです。これらの制限により、回帰モデルの予測精度は著しく制限されていました。
対照的に、DiffSyn モデルは、生成拡散モデルに基づいたまったく新しいアプローチを採用しています。従来の生成的敵対的ネットワークと比較すると、拡散モデルは、トレーニングを通じてノイズの多いデータからノイズを除去し、多様な出力を生成できます。変分オートエンコーダなどの深層生成法と比較すると、拡散モデルの反復的なノイズ除去プロセスは、高い表現力をもたらし、優れたサンプル品質を実現するだけでなく、合成空間における競合する相間の境界を捉えることさえ可能にします。これが、本研究を先行研究と区別する核心的な特徴です。著者の言葉を借りれば、「これは、構造と構成の間の 1 対 1 のマッピングから 1 対多のマッピングへのパラダイム シフトです。」

これは、高次元合成空間でゼオライト材料を予測する DiffSyn の能力の鍵でもあります。
コア制御機構 – 化学誘導
DiffSyn のもう一つの重要な特徴は、「化学ガイダンス」です。 DiffSynは、パラメータセットをランダムに出力するのではなく、化学的なガイダンスを用いて、拡散モデルを用いて化学原理に準拠し、標的ゼオライト構造を標的とする合成経路を生成します。具体的には、標的ゼオライト構造Czeoと有機構造誘導剤(OSDA)Cosdaを入力と出力として使用します。下の図をご覧ください。

OSDA は、ゼオライトの細孔構造を「テンプレート化」できる有機分子であり、それによって、下の図 e に示すように、合成プロセスを誘導して特定の構造を形成します。

そして最も重要なのは、このモデルは決定論的なパラメータを学習するのではなく、条件付き確率分布を学習します。標的構造とOSDAを与えると、ゲル組成Xcompと合成条件Xcondを含む合成経路のセットが生成されます。これが、前述の「1対多」の関係を解決する鍵となります。
トレーニングの過程で、順方向拡散処理(ワークフロー図の赤い矢印の部分)では、Xcomp と Xcond にガウスノイズを追加し、徐々にガウス分布に変換します。推論段階では、逆拡散プロセス(ワークフロー図の緑の矢印で示されています)は、ガウスノイズから始まり、分類器に依存しないガイダンス戦略を用いて、化学的に誘導されたU-Netを通じてノイズを反復的に除去します。下の図をご覧ください。

Tステップのノイズ除去後、モデルは標的構造に対応する合成経路を生成できます。逆拡散プロセス中、ワッサーシュタイン距離やCOV-P(精度)などの生成指標は継続的に最適化され、ノイズ除去プロセスの有効性が検証されるとともに、化学誘導の役割も実証されます。
DiffSynワークフローの実装 - デュアルエンコーダ、機能融合エンコーダ
モデルアーキテクチャの観点から言えば、DiffSyn はデュアル エンコーダー アーキテクチャを採用しており、ゼオライト構造と OSDA を独立したエンコーダー (Enczeo と EncOSDA) を通じて処理します。
ゼオライト構造を特徴付けるために、研究チームは構造的特徴を抽出するための二重の特性評価戦略を採用しました。1つは不変の幾何学的特徴で、チームはZeo++ソフトウェア パッケージを使用して、細孔容積、リングサイズ、最大包囲球径などのゼオライト構造から関連する物理的記述子を抽出し、それを学習のために多層パーセプトロン エンコーダーに入力します。もう1つは等変グラフィカル ニューラル ネットワーク (EGNN) 特性評価で、チームは等変グラフィカル ニューラル ネットワーク エンコーダーを使用して、ゼオライト結晶構造スペクトル データから化学的に意味のある潜在空間特徴を直接学習します。
* データは国際ゼオライト協会 (IZA) データベースから取得されています。
有機構造誘導剤の特性評価のため、研究チームはRDKitを用いて有機構造誘導剤の複数のコンフォメーションを生成し、MMFF94力場を用いて各コンフォメーションについて気相構造最適化を行った。そして、全てのコンフォメーションにおける分子容や二次元形状記述子などの物理化学的記述子の平均値を有機構造誘導剤の特性として算出した。
その後、研究チームはゼオライトの構造的特徴と有機構造誘導剤の構造的特徴を組み合わせ、Encfusionエンコーダーを用いて両者の結合特性を学習し、化学誘導情報を生成しました。この結合特性は、拡散モデルの逆ノイズ除去プロセスをガイドするために使用され、生成された合成経路が化学原理に準拠していることを保証します。特に注目すべきは、DiffSynは、学習中には見られなかったものの、文献で報告されている合成経路を反映した合成パラメータを生成できることです。下の図をご覧ください。

さらに、分類器に依存しないガイダンスもDiffSynの重要な要素です。その基本原理は、追加の分類器を追加することなく、条件付きスコア関数(化学ガイダンス情報を含む)と無条件スコア関数(ガイダンス情報を含まない)を重み付けして組み合わせることで、生成プロセスを制御することです。実験では、Puncond = 0.1、W = 1.0が最適であることが示され、生成される合成経路の多様性と品質のバランスが最適になりました。
* Puncondは、学習中に化学誘導をランダムに省略する確率です。値が高すぎると生成パスに過度の制約が生じ、値が低すぎるとターゲット構造へのターゲティングが減少します。
* W は推論時の加重条件スコアの重み、つまりガイド強度を表します。
まとめると、上記は、目標のゼオライト材料を生成するための合成経路の化学的合理性を確保し、目標構造を正確にターゲティングし、モデルの一般化能力を向上させるための重要な基礎を築くものです。
多次元の実験比較: 比較パフォーマンスは最先端技術 (SOTA) に達し、実用的な結果は報告された最高値を更新します。
DiffSyn の性能を検証するために、研究チームは実験段階で、従来の方法との比較や、予測されたゼオライト合成経路と文献レポートとの比較など、複数の一連の実験を設定しました。
回帰モデルと従来の生成モデル/深層生成モデルとの比較
研究チームは、DiffSynと比較するために3つのベースラインモデルを構築し、提案手法の性能と機能を評価しました。3つのベースラインモデルは以下のとおりです。
* 回帰モデル: AMD (平均最小距離) と BNN (ベイジアンニューラルネットワーク)
* 古典的な生成モデル:GMM(ガウス混合モデル)
*深層生成モデル: GAN (条件付き生成敵対ネットワーク)、NF (正規化フロー)、VAE (変分オートエンコーダ)
実験では、生成されたデータと実際のデータ分布の差を測る指標としてワッサースタイン距離を使用し、生成された合成経路の多様性の評価指標としてカバレッジ指標 COV-F1(0~1 の範囲で値が高いほど優れている)を使用しました。
ワッサースタイン距離は、GAN、NF、VAE、DiffSyn などの深層生成モデルが従来の方法よりも大幅に優れていることを示しています。DiffSyn は、準最適ベースライン (VAE) を 25% 以上改善します。下の図 a に示すように:

さらに、深層生成法は、主にCOV-R(再現率)が高いため、一般的に回帰モデルよりも優れた性能を発揮します。注目すべき点は…DiffSyn は COV-P が高いため、他の深層生成モデルよりも優れています。さらに、DiffSyn は回帰ベースの方法のように明示的な平均絶対誤差ターゲットを使用してトレーニングされていませんが、下の図 c に示すように、12 個の合成パラメータのうち 10 個で最低の平均絶対誤差を達成しています。

さらに、研究チームは、すべての方法を使用して予測された複数の合成パラメータの結合分布と、AEL ゼオライトの実際の結合分布を比較しました。深層生成法のみが、このタイプの結晶構造の結晶化温度と時間の真の複合分布を捉えることができます。その中で、DiffSyn は、実際のデータ ポイントのほとんど (一部の外れ値を含む) を含めて結合分布を最も正確にキャプチャしますが、二次パターンのデータ ポイント (極端な外れ値) を予測することはできません。
その後の検証では、研究チームは DiffSyn を使用して複数の合成パラメータの結合分布を学習し、これまで見たことのない 2 つのゼオライト-OSDA システムの 2 つの合成パラメータを調べました。結果は、DiffSyn が材料合成の分野における特定のルールを習得したことを確認しました。それは重大な化学的意味合いを持っています。
生成された合成経路を文献で報告されたものと比較します。
研究チームは、研究価値と産業応用の見通しを持つ複数のゼオライト-OSDA系を選定し、DiffSynによって生成された合成経路と文献で報告されている経路との差異を比較し、未知のMWW型およびBEC型ゼオライト、そしてFAU/LTA競合結晶相系における合成-構造関係を学習するDiffSynの能力を検証しました。下図をご覧ください。

まず、MWW システムについてですが、これは 10 員環と大きな空洞を持つ 2 次元構造であり、異性化反応や芳香族化反応に使用されます。 DiffSyn によって生成された OH⁻/T、K⁺/T、H₂O/T、SDA/T、温度、および時間パラメータは、実際の合成パラメータと高い一致を示します。これは、DiffSyn が、目に見えない構造でも適切なウィンドウを再現できることを証明しています。
第二に、BEC システムに関しては、交差する 12 員環チャネルを含む 3 次元細孔トポロジーを備えたマクロ多孔性ゼオライトであり、異性化およびエポキシ化反応に適しています。 DiffSynによって生成された合成パラメータSi/Ge、F⁻/T、および温度/時間は、文献で報告されているものと非常によく一致しています。特に、文献ではGeとF⁻が合成プロセス中にBEC構造の二重四員環(d4r)を安定化すると指摘されており、DiffSynも同様の効果を発揮します。これは、DiffSyn が特定のヘテロ原子または合成条件を学習して、ゼオライト内の特定の構造単位の形成を促進できることを示しています。
最後に、研究チームはDiffSynを用いて、OSDAを含まないFAUおよびLTAゼオライトの合成経路を予測しました。DiffSynによって生成された合成経路は、文献で報告されている経路と高い一致を示しました。注目すべき点は、DiffSyn は、OSDA なしで FAU と LTA 間の相境界領域を正確に予測し、競合相の形成のための合成空間を明確に定義しました。この結果は、DiffSynが構造と合成の関係を正確に捉えるだけでなく、合成と構造の決定境界を逆解読できることを示しており、相選択的合成におけるその可能性を実証しています。また、高い汎用性と適用性を備えており、様々なゼオライト構造とそれに対応する化学系に適用できます。
最適合成経路の生成の検証
合成経路の生成と最適な合成経路の計画は、同じ問題の2つの側面です。これに対処するため、研究チームはDiffSynが後者を達成する能力を評価しました。
この実験では、有機構造誘導剤としてトリメチルアダマンチウムアンモニウム(TMAda)を用いてCHA型ゼオライトを合成し、複数の組み合わせ経路を生成し、対応する前駆体コストと結晶化時間を計算しました。下の図をご覧ください。 DiffSyn によって生成された部分的な Praeto 最適ルートでは、文献で報告されている 20 の最も低コストの合成ルートと比較して、結晶化時間が短く、前駆体コストが低くなります。

やっと、研究チームは、UFI型ゼオライトを生成するDiffSynの合成経路を実験的に検証し、4種類のUFI型ゼオライト材料の合成に成功しました。UFI 型ゼオライトの合成では、研究チームは OSDA として Kryptofix 222 (K222) を選択しました。このシステムはトレーニング データに出現しなかったため、DiffSyn の一般化能力をテストするのに役立つためです。
DiffSynは1000通りの合成経路を生成し、その分布は、下図に示すように、報告されているすべてのゼオライト合成経路分布のサブスペース内に収まっています。さらに、この研究では、競合する結晶相のほとんどが、標的結晶相と共通の複合構造単位を共有していないことが明らかになりました。これは、構造と合成の関係が複雑であり、構造単位だけでは説明できないことを裏付けています。

試験結果では、合成サンプルの粉末X線回折パターンがシミュレーションパターンと高い一致を示しました。得られた結晶はUFI型ゼオライト構造であることが確認され、ICPで測定したシリコンとアルミニウムの比は19.0と高く、これは現在までにUFI型ゼオライトの合成で報告された最高値の一つです。
さらに重要なのは、研究チームがDiffSynと人間の専門家との連携が理想的な合成結果を得るために不可欠であることを強調し、結晶化温度の例を用いてこの主張を検証したことです。結論として、モデルが合成経路を提示し、人間の専門家が経験に基づいて修正や意思決定を行うという点が、材料合成計画における人工知能の将来的な応用の鍵となる可能性があります。
この「レシピブック」は、さまざまな資料を使って「何を合成するか」と「どのように合成するか」を結び付けています。
材料合成と人工知能の分野の相互統合が深まり、材料合成分野が知能化、精密化、統合化に向かうための加速器を提供します。
まず、人工知能、特に生成型人工知能の活発な発展は、材料合成データベースの形成を加速させています。特に産業界では、GoogleやMetaといったテクノロジー大手が生成型人工知能に多額の投資を行い、膨大な材料合成式データベースを構築しています。これらの式は理論的に、材料合成とイノベーションのための肥沃な土壌を提供しています。
さらに、関連データベースは、特に学術研究のより集中的な発展に伴い、特定のサブ分野において継続的に改善・拡充されています。例えば、本研究に先立ち、研究チームは既にゼオライト材料の長期追跡調査を実施していました。現在公開されているゼオライト合成データベースの規模が小さく、数が限られているという課題に対処するため、研究チームは23,961件のゼオライトの水熱合成経路を含むデータセット「ZeoSynデータセット」を提案しました。同時に、合成経路に基づいてゼオライトを予測する機械学習分類器も開発し、70%の精度を達成しました。これは、研究チームの今後の研究のための確固たる基盤を築き、強力な理論的裏付けとなりました。
* 論文タイトル:
ZeoSyn: 水熱パラメータの機械学習による合理化を可能にする包括的なゼオライト合成データセット
* 紙のアドレス:https://dspace.mit.edu/handle/1721.1/164092
物質合成処方データベースは、「レシピ」における「メニュー」のようなものです。前述のように、「メニュー」だけでは不十分で、「調理法」が不可欠です。回帰モデル、生成モデル、そして拡散モデルといった手法の応用は、研究者が絶え間なく探求し、美味しい料理を創り出す過程に似ています。これらの人工知能技術の応用は、「メニュー」の各料理に様々な「調理法」を加え、最終的に「レシピ」を完成させるようなものです。
最後に、物質合成のプロセスは料理に似ている一方で、大きく異なる点もあります。通常の料理と比較すると、成功した物質合成は、独特の風味を持つ料理よりもはるかに価値があります。新たな物質の誕生は、未知の世界への扉を開き、人類の文明と時代の進歩を推進する無限の可能性を秘めているのかもしれません。








