Command Palette
Search for a command to run...
MIT は、あらゆる事前トレーニング済みの拡散モデルに適応できる安定した材料を対象とした設計である SCIGEN を開発しました。

材料科学において、物質の量子特性(トポロジカル絶縁性、超伝導性、磁気秩序など)は単独で存在するのではなく、原子配列の対称性や格子構造といった構造特性によって直接決定される。これは、構造操作による量子物質の標的設計の理論的根拠となる。しかし、「理論的可能性」から「実用性」への飛躍は容易ではない。構造操作の複雑さや関連データの不足といった現実的な要因により、理想的な量子特性を持つ安定した物質設計の進展は遅い。例えば、10年間の研究を経ても、量子スピン液体の候補物質はわずか12種類しか見つかっていない。
人工知能(AI)がもたらす科学的パラダイムシフトは、材料設計の方法論とアプローチを根本から変革しています。例えば、CDVAE、UniMat、DiffCSP、GNoMEといった主流の材料生成モデル(主に拡散モデルまたはグラフニューラルネットワークアーキテクチャに基づく)は、安定した結晶構造の特定や数百万もの候補材料の一括生成において、大きな可能性を示しています。しかし、ほとんどの方法は依然としてトレーニング データの統計的分布からのサンプリングに依存しているため、出力マテリアルは構造トポロジーとパフォーマンス特性の観点から既存のデータベース内の一般的なタイプに限定されてしまいます。しかし、結晶学的空間群は物質のマクロ的な構造枠組みを提供するに過ぎず、重要な局所的な幾何学的パターンを捉えることができません。したがって、特定の幾何学的パターンの制約を正確に組み込むことができる機械学習手法の開発は、既知物質のボトルネックを打破し、新たな量子現象を探索するための鍵となります。
量子材料の研究開発における困難を観察し、MITのミンダ・リー教授のチームは、ミシガン州立大学、オークリッジ国立研究所などと共同で、SCIGEN(Structural Constraint Integration in a GENerative model)と呼ばれる幾何学的構造制約統合手法を提案しました。この手法は、事前学習済みの生成拡散モデルに適応させることで、対称性や幾何学的パターンの制約を組み込むことができ、特定の制約を持つターゲットマテリアルを生成することができます。この手法の主な利点は、基盤となるモデルの再学習や微調整が不要になることです。これにより、フレームワークの柔軟性と汎用性が大幅に向上し、様々な事前学習済み拡散モデルへの迅速な適応が可能になり、効率と速度が向上します。
関連研究はトップジャーナル「ネイチャーマテリアルズ」に「量子材料発見のための生成モデルにおける構造的制約の統合」というタイトルで掲載されました。
研究のハイライト:
* この研究では、ベースモデルの再トレーニングや微調整を行わずに、事前トレーニング済みの拡散生成モデルを適応させるソリューションを提案し、従来の制約生成モデルがベースモデルの二次トレーニングに依存していた状況を打破します。
* 同研究所が提案した手法は、量子物質発見における「試行錯誤」から「指向的生成」へのパラダイムシフトを促進し、量子物質の開発を加速させた。
* この研究では、常磁性と反磁性を示す2つの予測物質、TiPd₀.₂₂Bi₀.₈₈とTi₀.₅Pd₁.₅Sbを合成し、特性評価を行った。

用紙のアドレス:
https://www.nature.com/articles/s41563-025-02355-y
公開アカウントをフォローして「サイゲン 完全なPDFを入手する
AIフロンティアに関するその他の論文:
データサポート:大規模アルキメデス格子材料データベースの構築とスクリーニング
この研究では、研究者らは SCIGEN を使用して、実験的探究のための AL (アルキメデス格子) 材料の包括的なデータベースを作成しました。
このデータセットには、AL を含む合計 1,006 万件の資料が含まれています。研究者らは4段階の安定性事前スクリーニングを経て、101万件以上の材料を選定しました。その後、26,000件の優先度の高い材料に対して高スループットDFT(密度汎関数理論)構造緩和計算を実施し、24,743件の材料の収束に成功しました。951件以上のTP3T構造が収束し、531件以上のTP3T材料が150ステップの構造最適化でエネルギー最小値に到達しました。
磁気構造を特定するために、研究者らはグラフニューラルネットワークベースの分類モデルを使用し、41% の DFT 最適化構造が磁気構造であると特定しました。
最後に、材料データのスクリーニング後、研究者らは、TiPd₀.₂₂Bi₀.₈₈とTi₀.₅Pd₁.₅Sbという2つの新しい材料も合成した。
モデル分析: 設計ロジックを最適化し、材料生成モデル機能を向上させる
SCIGENは、拡散生成プロセスに幾何学的制約を直接統合することで、物質生成モデルが目標とする幾何学的形状と量子特性を持つ安定した量子物質をより効率的に探索することを可能にします。「制約ガイダンス-マスク反復-ノイズ除去収束」という論理チェーンを用いて、目標とする制約から開始し、ランダムな制約構造を複数の時間ステップにわたって拡散させます。拡散の前に、制約構造はノイズ除去された構造をマスクし、制約を満たす出力を生成するように生成プロセスを導く誘導バイアスを形成します。ノイズ除去の各ステップでマスクを反復的に適用することにより、マスクに属するすべての原子は、課されたすべての幾何学的構造にわたる位置に決定論的に収束します。したがって、SCIGENは、生成された物質が事前に設定された幾何学的制約を満たすことを保証すると同時に、基礎モデルの生成妥当性を維持します。
具体的には、結晶構造生成の目的は、3つの成分から構成される周期結晶Mを見つけることです。これらは、結晶の全体的な空間フレームワークを記述する 3 つの基底ベクトルを含む格子行列 L = [l₁, l₂, l₃] ∈ R³ᕽ³、格子内の原子の相対位置を表す分数座標 F = [f₁, f₂, …, f៷] ∈ [0, 1)³ᕽᴺ (周期性を反映するため [0, 1) の範囲に制限)、およびバイナリ コードを使用して各原子の特定のタイプを識別するワンホット原子タイプ エンコーディング A = [a₁, a₂, …, a៷] ∈ [0, 1)ʰᕽᴺ です。拡散ベースの材料生成中、SCIGEN は L、F、および A に幾何学的制約を適用して、生成された構造がターゲットの形態に準拠するようにします。
下の図aに示すように、SCIGEN が制約できる代表的な格子としては、三角格子、ハニカム格子、カゴメ格子などがあります。これらは、量子スピン液体などのユニークな量子現象をホストするコア構造です。

下の図bは、制約構造の初期化プロセスを示しています。制約構造を初期化するための基本ルールは、「磁性原子で構成されるアルキメデス格子」に基づいており、これにより、制約構造は最初から潜在的な量子特性を持つことが保証されます。図cは、統合された制約コンポーネントの生成アルゴリズムを示しており、「制約構造の拡散 - 制約のない構造の初期化 - 両者の融合 - 反復的なノイズ除去」というプロセス全体を視覚的に示しています。

その中でも、初期化から最終構造 M₀ の生成までの SCIGEN の中核となるのは、「制約付きコンポーネントと制約なしコンポーネントの反復的な統合」です。まず、初期化された制約構造(磁性原子で構成されたALなど)にT = 1000ステップのノイズを追加して、各時間ステップで制約構造Mᶜₜ(t∈[1, T])を取得します。このステップは、制約されたコンポーネントのノイズ除去のための「事前設定パス」を提供し、後続の生成が目標形状から逸脱するのを防ぎます。制約のない構造は、最初は完全にノイズの多いMᵘₜで構成され、これは生成プロセスのうち自由に最適化できる部分を表しています。次に、これら2つの構造を統合して複合構造MTを形成し、これをノイズ除去してMᵘₜ₋₁を生成します。このロジックは後続のすべてのステップで繰り返され、最終的にはいくつかの原子が反復処理を通じてAL平面構造を形成するように誘導され、結果として目標の結晶構造M₀が得られます。
SCIGEN制約の有効性を証明するために、この研究では、数学的証明と計算検証の両方から、SCIGEN が制約を課す際に基礎モデルの元の分布を破壊しないことも証明されました。大量の材料を生成した後、「4段階事前スクリーニング+ハイスループットDFT緩和」を通じて安定性を評価し、潜在的に安定な量子材料候補を確実に選別します。
* 4 段階の事前スクリーニング プロセスでは、電荷の中性および原子が占める単位格子の体積をチェックする化学ルールと、凸包エネルギー Eₕᵤₗₗ 値に基づいて安定性を予測する補助ニューラル ネットワークが組み合わされています (Eₕᵤₗₗ 値が低いほど、材料の熱力学的安定性が高くなります)。
* ハイスループットDFT緩和法は、選別された材料に対して密度汎関数理論計算を実行します。構造緩和(原子位置と単位格子寸法の最適化)を通じて、最終的に安定性の高い候補物質を特定し、その後の実験合成や詳細な研究の基盤を提供します。
実験検証:SCIGENは優れた方向性生成と材料予測能力を実証
具体的な実験では、基本モデルにDiffCSPモデルを採用し、基本生成モデルの機能の保持も検証しました。
初め、実験では、3 つの主な AL 制約の下でのマテリアル生成の結果を示します。SCIGEN の方向性生成能力は、下図に示すように、三角格子、ハニカム格子、カゴメ格子に基づいて検証されます。

結果は次のようになります。SCIGEN は、制約された原子が事前に定義された幾何学的パターンに配置される様に正確に誘導することができ、制約はターゲットコンポーネントにのみ作用します。拘束されていない原子の位置は厳密に定義されていないため、方向性があり柔軟な生成プロセスが保証されます。拘束されていない原子の位置は、空間要因と結合要因の影響を受けて、生成プロセス中に自然に決定されます。三角格子の場合、拘束されていない原子は3つの磁性原子を接続する位置を占め、正三角形を形成する傾向があります。ハニカム格子の場合、拘束されていない原子は通常、磁性原子によって形成される六角形の中心に現れ、格子面と同一平面にあります。カゴメ格子の場合、拘束されていない原子は各カゴメ格子層の正三角形と六角形を接続します。格子多角形の内部空間が狭すぎる場合、それらはAL平面の外側にオフセットされます。六角形などのより大きな多角形の場合、それらは拘束された原子と同一平面に配置できます。
より安定確率の高い閉じ込め材料構造を生成するため、研究者らは事前スクリーニング生存率を分析することで、初期条件サンプリングスキームも設計しました。鍵となるのは、「単位セルあたりの原子数(N)」と「AL頂点における磁性原子の種類」の最適な選択を決定することです。研究者らはまず、均一分布からN値をサンプリングし、異なるN値に対応する「多段階事前スクリーニング生存率」を計算して、Nの安定した確率分布を得ました。この分布に基づいて、大規模生成を初期化するためのNをサンプリングしました。三角格子はN値が小さいほど適しており、ハニカム格子とカゴメ格子はN値が大きいほど適しています。これは下の図dに示されています。

図 e: 各主要幾何学パターンにおける一般的な磁性原子タイプの事前選別後に残った材料の量。
上の図eに示すように、10個の一般的な磁性原子(Mn、Fe、Co、Ni、Ru、Nd、Gd、Tb、Dy、Yb)が実験的にテストされました。格子の種類と磁性原子ごとに3,000個の物質を生成し、事前スクリーニング後の安定した物質の数をカウントしました。結果は、安定物質の量は磁性原子の種類によって異なるものの、10種類の磁性原子すべてがAL構造を形成できることを示しています。そのため、大規模に生成する際には、多様性と安定性の両方を考慮するため、AL頂点原子の種類に対して「等確率サンプリング」を採用しています。
SCIGENは、上記の3つの主要な格子に加えて、正方形、細長い三角形、切頂正方形などの他のアルキメデス格子にも適用でき、合計7種類のAL拘束材料が存在します。これらの格子では、拘束されていない原子も重要な役割を果たし、格子層間の隙間を埋めることで、構造の機械的および熱的安定性を高めます。これらの原子は、自発的に認識可能なALパターンを形成することさえあります。これは、AL構造が局所座標において「固定された安定性の選好性」を持つことを示唆しており、よりユニークな量子材料の探索の基盤を提供します。(下図参照)

正方形ALのバリエーションとして、研究者らはまた、SCIGEN の Lieb 格子材料生成における画期的な進歩を実験的に実証しました。結果は、SCIGENが幾何学的制約を通して安定したLieb格子材料を生成できることを示しており、希少な格子構造を生成する能力を実証しています。これらのLieb格子材料では、TbやDyなどの磁性原子がLieb格子のノードに配向しており、磁気特性研究の基礎となっています。生成された材料に対するその後のDFT構造緩和計算により、Lieb格子構造全体が損なわれていないことが明らかになりました。さらにバンド計算を行ったところ、これらの材料はフェルミ準位付近で予想通りの電子フラットバンド特性を示すことが明らかになりました。これは、SCIGENが生成した材料が構造的に安定しているだけでなく、Lieb格子特有の量子電子挙動を示すことを裏付けています。これは下の図に示されています。

SCIGEN は、Lieb のような格子材料を実用的な超伝導材料の酸化物類似物に近づけるために、制約の剛性と構造の柔軟性のバランスをとる「適応型デマスキング」戦略を導入し、Lieb 格子の基礎研究と超伝導アプリケーションの探究の間に橋を架けました。
SCIGENの予測能力と有効性を検証するために、研究者らは、TiPd₀.₂₂Bi₀.₈₈とTi₀.₅Pd₁.₅Sbという2つのまったく新しい化合物を合成し、テストしました。実験の結果、SCIGENが予測した対応物とは化学量論および結晶対称性に若干の違いが見られるものの、実験結果は計算結果と高い整合性を示すことが示された。前者は常磁性を示し、後者は反磁性を示す。これは、SCIGEN が化学的に妥当な構造モチーフを提案する能力を持っていることを証明しており、理想的な形ではないものの、さらなる研究のための基礎と価値を提供することができます。
要約すると、革新的な汎用機械学習ベースのフレームワークである SCIGEN は、これまでアクセスできなかった材料設計空間の領域を開拓し、構造と性能の関係に基づく量子材料のブレークスルーへの道を開きます。
量子物質の発見と人工知能が衝突し、素晴らしい花火を生み出す
「構造と性能の関係」は、現在の新材料研究開発における中核概念となっている。この関係には二つの重要な利点がある。第一に、構造を通して材料の機能的量子現象を理解すること、第二に、性能を通して材料の微細構造を予測すること、そして構造操作を通して標的材料の的確な設計を可能にすることである。人工知能の発展は、科学者がこれら二つの側面の関係を体系的に研究するための新たな「高速道路」を間違いなく切り開き、新材料研究開発を加速させる新たな機会を提供している。
上記の成果に加え、科学研究コミュニティでは、本稿で言及した基本モデルの研究など、構造と性能の関係を研究してきた長い歴史があります。その中で、Google DeepMind チームは「材料発見のためのディープラーニングのスケーリング」と題した研究を発表しました。大規模な能動学習による材料探索の機械学習拡張を実現するために、GNoME (材料探索のためのグラフネットワーク) と呼ばれる手法が提案されています。
この手法は、2つの主要な要素に基づいています。1つ目は、対称性を考慮した部分置換(SAPS)やランダム構造探索といった、多様な候補構造を生成する手法を確立することです。2つ目は、高度なグラフニューラルネットワーク(GNN)を用いて結晶全体のエネルギーを予測することです。GNoMEモデルは反復的なプロセスで、既存のデータを用いて候補構造の学習とスクリーニングを行います。DFTエネルギー計算によって予測が検証され、次の学習ラウンドのためのデータが得られます。最終的に、220万を超える安定構造が発見されました。更新された凸包には 381,000 個の新しいエントリが含まれています。安定結晶の数が従来に比べて一桁増加しました。
用紙のアドレス:
https://www.nature.com/articles/s41586-023-06735-9
前述の実験で使用された基礎モデルは、清華大学、中国人民大学、中山大学のチームが実施した「ジョイント等変拡散による結晶構造予測」と題する研究から得たものです。この研究では、結晶構造予測という困難な問題を解決するために、DiffCSPと呼ばれる手法を提案しました。このモデルは、周期的等変ノイズ除去モデルに基づいて設計されており、各結晶の格子座標と原子座標を共同で生成し、結晶形状をより適切にモデル化できます。
用紙のアドレス:
https://arxiv.org/abs/2309.04475
要約すると、SCIGEN法は先行研究に基づく革新です。「制約付き統合」を通じて基本的な拡散モデルを洗練させ、量子物質発見のための新たな、標的を絞った効率的な道を切り開き、「スケール化された試行錯誤」から「指向された設計」へと量子物質の研究開発を促進します。その汎用性は、未知の量子構造と特性を持つ物質の探究のための中核的な枠組みの基盤となります。