超伝導材料探索効率が5倍に向上!フロリダ大学などがディープラーニングを使って材料発見を変革し、その結果がネイチャー誌に掲載された。

SF映画「アバター」では、緑の蔓が絡み合い雲間に浮かぶ惑星パンドラのハレルヤ山が、観客に深い印象を残したに違いありません。その秘密は、山中に眠る常温超伝導鉱物「アンオブタニウム」にあります。映画では、地球上に存在しないこの宝を奪うために、人類はナヴィ族の故郷を破壊しようとしている。これは単なる架空の物語だが、現実には、物理学者の超伝導物質への欲求と追求は、映画の中で人類が「アンオブタニウム」に執着するのと同じくらいである。なぜなら、理論上、超伝導材料は無尽蔵のエネルギー供給を提供できるからです。
研究者による超伝導材料の研究は2023年に小さなクライマックスを迎えた。当時、韓国チームは常温超伝導物質LK-99を発見したと主張し、世界中から大きな注目を集め、ChatGPTに続くもう一つの大きな技術的進歩とさえ考えられていた。この発見は最終的に誤解であったことが証明されましたが、これによって超伝導材料の人気が再び高まり、この分野の大きな可能性が人々に認識されるようになりました。
AI for Scienceの台頭により、人々は大胆に想像し始めました。AI技術は室温超伝導材料の発見に使用できるのだろうか?理論的には、これは完全に実現可能であり、課題は残っているものの、いくつかの研究チームがすでにこの点に関して重要なステップを踏んでいます。例えば、米国のフロリダ大学とテネシー大学の研究者は、ディープラーニングモデルBETE-NETを通じて金属の電気音響相互作用エリアシュバーグスペクトル関数α²F(ω)を予測することに成功し、高温超伝導体の探索効率を5倍に高めました。この成果は、超伝導材料の発見に新たなアイデアと方法を提供するだけでなく、材料科学分野における AI 技術の応用例も示しています。
関連する結果は、「電子フォノンスペクトル関数の強化されたディープラーニングによる超伝導体の発見の加速」というタイトルで学術誌npj Computational Materialsに掲載されました。

用紙のアドレス:https://www.nature.com/articles/s41524-024-01475-4
公式アカウントをフォローし、「BETE-NET」と返信すると完全なPDFが手に入ります
データセットのダウンロードアドレス:
オープンソース プロジェクト「awesome-ai4s」は、200 を超える AI4S 論文の解釈をまとめ、膨大なデータ セットとツールを提供します。
https://github.com/hyperai/awesome-ai4s
超伝導材料のジレンマ: トレーニングデータセットと機械学習技術の間の「ジレンマ」
超伝導体に対する AI モデルの有効性は、一般的に、トレーニング データセットと機械学習手法の選択という 2 つの重要な要素によって決まります。これら 2 つの重要な要素を解決することによってのみ、超伝導材料の研究開発をより効果的に推進し、将来の科学技術革新のための強固な基盤を築くことができます。しかし、どちらの方向にも多くの困難が伴います。
まず、金属の超伝導特性を迅速かつ正確に推定できるモデルには、通常、材料情報データベースからの数万のデータ ポイントが必要です。しかし、他のデータベースとは異なり、対応する大規模なα²F(ω)データセットを開発することは非常に困難です。これは、法外なコストがかかるだけでなく、α²F(ω) を正確に計算するための標準化された密度汎関数理論パラメータ セット (k 点密度、q 点密度、平滑化値など) が不足していることも原因です。これらの障害を考慮すると、科学者は、現在の困難を打破し、超伝導特性推定モデルの開発を促進するために、小さなデータセットを効果的に処理できる一連の機械学習技術を必要としています。
第二に、超伝導研究の分野では、研究者はそのようなモデルを使用する際に、利用可能なデータセットが異質で数が限られているという大きな課題に直面することがよくあります。長い間、超伝導材料の研究は、超伝導特性に関するデータが限られているという問題を解決するために、実験的な Tc 値を含むよく知られた「SuperCon」データベースに主に依存してきました。しかし、データベースには、重複したエントリ、疑わしい値、不明瞭な化学式など、多くの問題があります。この大規模で包括的なデータセットの欠如は、新しい超伝導材料の開発を大きく制限するだけでなく、エネルギー伝送、輸送分野での磁気浮上、医療画像診断における強力な超伝導磁石における超伝導材料の革新的な可能性を著しく妨げます。
グラーツ工科大学の理論・計算物理学研究所が提案した高圧水素化物のみを含むSuperhydraデータベース、ドイツのハレ物理学研究所が立ち上げたホイスラー超伝導体に焦点を当てたデータベース、ポルトガルのコインブラ大学物理学部の研究者が7,000件の電子フォノン計算に基づいてトレーニングしたモデル、米国の国立標準技術研究所が開発した626の動的に安定した材料とそれに関連するα²F(ω)を含むデータベースなど、物質構造と計算されたα²F(ω)のデータベースは数多く登場しているが、これらのデータベースはα²F(ω)の予測においてまだ性能が低い。
これらの問題をより良く解決するために、この研究では、フロリダ大学とテネシー大学の研究者が、包括的なエリアシュバーグスペクトル関数データセットを作成し、最新のディープラーニング技術を使用して堅牢なモデルを開発することで、これら2つの重要な要素に対処することに成功し、超伝導材料の研究開発に新たな道を開きました。この成果は、超伝導材料の研究に新たな方法とツールを提供するだけでなく、将来の科学技術の革新と応用のための強固な基盤を築くものでもあります。
BETE-NET: 限られたデータで計算探索の限界を大幅に拡大
電子-フォノン結合を計算するときは、コーン・シャム波動関数の計算に使用される k 点メッシュが、フォノンの計算に使用される q 点メッシュと一致していることを確認する必要があります。データセットの問題に対処するために、本研究ではまず、異なる単位セル体積を持つ材料を処理するために固定メッシュを使用する代わりに、ユーザーが提供する k および q ポイント密度に基づいてメッシュを生成できる、k メッシュと q メッシュの標準化された選択のためのアルゴリズムを提案しました。このアプローチにより、研究者はデータの均一性と品質を向上させただけでなく、データセットの幅広い適用性も確保しました。その結果、818 種類の動的に安定した材料に対する高品質な電子フォノン計算の包括的なデータベースが作成されました。次に、研究者らは、818 個の動的に安定した材料を 80%-20% の比率でトレーニング セットとテスト セットに分割しました。
データセットのダウンロードアドレス:
https://go.hyper.ai/GjZDo
研究者らはデータセットの品質を評価した後、データベースサイズが限られているというディープラーニングの問題に対処するために BETE-NET をさらに設計しました。下図に示すように、BETE-NET モデルは結晶構造をグラフに変換し、一連の畳み込みおよびゲートブロック演算を通じて、サイト投影の原子番号、原子質量、原子間距離、および PhDOS 情報を組み合わせ、最後にプーリング演算を通じて α²F(ω) の予測値を生成します。 PhDOS 情報を導入することで、モデルの予測性能が大幅に向上します。この設計は、結晶構造の情報を最大限に活用するだけでなく、材料の振動特性も組み合わせることで、超伝導材料のα²F(ω)を予測するモデルの精度と信頼性を高めます。最終的に、この研究では 3 つのバリアントを訓練しました。
* CSO (結晶構造のみ) バリアント: 予測に結晶構造情報のみを使用するモデルの基本ネットワーク。
* CPD (粗い PhDOS) バリアント: このモデルは、サイト投影フォノン状態密度 (PhDOS) 情報を導入し、モデルの予測パフォーマンスをさらに向上させます。
* FPD (Fine PhDOS) バリアント: PhDOS はより細かい q メッシュを使用して計算され、材料の振動特性を捉えるモデルの能力がさらに向上します。

データが限られている場合、モデルはすぐに過剰適合する傾向があります。従来の機械学習では、過剰適合はモデルの一般化能力に悪影響を及ぼすと考えられていますが、多くのディープラーニング モデルは、損失がほぼゼロになるまでトレーニングすると、依然として良好な一般化誤差を維持できます。この現象は「二重降下」と呼ばれ、制御された過剰適合の一形態と考えることができます。下の図に示すように、二重衰退現象は、古典的レジーム、臨界レジーム、現代レジームの 3 つの段階で構成されており、各段階の損失状況が図に示されています。研究者らは、これらの損失地形をプロットすることで、ニューラルネットワークのバイアスと分散を直感的に解釈するもっともらしい方法を提案し、二重降下現象に対する定性的な説明を提供しています。

この研究は、高 Tc 材料のスクリーニングにおいてさらに検証されました。まず、この研究では、Tc^DFT≥5K のすべての材料を高 T 材料と定義し、最終的に 33 の材料がこの基準を満たしました。次に、この研究では各モデルの精度-再現曲線をプロットしました。結果は、CPD モデルと FPD モデルによって達成された平均精度 (AP) が、ランダム分類器の精度よりもほぼ 5 倍高いことを示しています。これは、これらのモデルが高 Tc 材料の識別において優れた性能を発揮し、ランダム分類器を大幅に上回っていることを示し、実際のアプリケーションにおけるモデルの有効性と信頼性を検証しています。

まとめると、BETE-NET モデルは、ドメイン固有の知識と高度なディープラーニング技術の完璧な融合の好例です。限られたデータで金属の電気音響相互作用エリアシュバーグスペクトル関数 α²F(ω) を効率的に予測できます。計算探索の境界を大幅に拡大するだけでなく、新しい超伝導体の発見を支援することで、社会に変革をもたらすことも期待されています。
等変ニューラルネットワーク: 材料産業における AlphaFold の誕生を支援
興味深いことに、この研究が発表された直後の1月17日、マイクロソフトのCEO、サティア・ナデラ氏は、同社のMatterGenモデルがネイチャー誌に掲載されたことを自ら発表した。このモデルは、現在知られている材料を超えて、AI を使用して特定のニーズに合った新しい材料を発見することができます。これは、材料設計分野における新しいパラダイム、つまり従来のデータベーススクリーニングから需要プロンプトに基づく新しい材料の直接生成への移行を示しています。一部のネットユーザーは「材料界のアルファフォールドがここにある」と叫んだ。
MatterGen モデルの鍵となるのは、その独自の拡散モデル アーキテクチャにあることは注目に値します。この拡散過程において、MatterGenモデルは等変分分数ネットワークを使用しており、これは本研究でもα²F(ω)を学習する際に選択されたモデルである。拡散過程、つまりノイズ除去過程から元の結晶構造を回復することを主に担っている。
等変ニューラル ネットワークは、従来のニューラル ネットワークに基づいて等変制約要件を追加します。ネットワーク内のすべての操作は等変である必要があるため、ネットワーク全体は等変マッピングになります。実際、等変ニューラル ネットワークは、材料分野における AI for Science 研究の主流となっています。
昨年9月、日本の東北大学とマサチューセッツ工科大学の研究者らが、GNNOptと呼ばれる新しい人工知能ツールを発表した。GNNOptは、等変ニューラルネットワークを統合することで、944の材料の小さなデータセットを使用して高品質の予測を実現し、太陽エネルギー変換効率が32%を超える246の材料と高い量子重みを持つ296の量子材料を特定することに成功し、エネルギーおよび量子材料の発見を大幅に加速しました。
昨年8月、清華大学のXu Yong氏とDuan Wenhui氏が率いる研究グループは、ニューラルネットワークDFTフレームワークを提案した。本研究では、等変ニューラルネットワークの入力条件として物質構造情報の埋め込みを利用し、ハミルトン行列を出力することで、ニューラルネットワークにおける損失関数の最小化と密度汎関数理論におけるエネルギー汎関数最適化を統合する。このフレームワークは、従来の教師あり学習法と比較して、精度と効率性が高く、ディープラーニング DFT 法の開発に新たな道を開きます。研究チームは以前、深層等変ニューラルネットワークフレームワークを使用して磁性材料のDFTハミルトニアンを表現し、効率的な電子構造計算を実行するxDeepH(拡張DeepH)法も提案しました。
現在、等価ニューラル ネットワークは超伝導材料の分野を新たな研究パラダイムへと導いています。超伝導材料の研究と応用はもはや研究室に限定されず、徐々に実生活に取り入れられつつあり、その市場潜在力も継続的に発揮されています。世界の超伝導材料市場は今後も拡大を続け、2027年までに192億ユーロにまで増加すると予想されています。等価ニューラルネットワークや超伝導材料などの AI 技術の深い統合により、人類は技術の「転換点」に触れ、無限の可能性に満ちた新しい時代を迎えています。
