触媒設計を加速するために、上海交通大学の He Yulian 氏の研究グループは、AutoML に基づいた自動知識抽出を実行しました。

特色图像

日常生活において「触媒」は最も一般的な化学反応の一つです。たとえば、ワインや酢の製造の本質は、微生物の酵素の触媒作用を受けて穀物中のデンプンをアルコールと酢酸に変換するプロセスです。

より学術的に言うと、化学平衡を変えることなく化学反応において反応物の反応速度を変化させる(増加または減少)ことができ、化学反応の前後でそれ自体の質量と化学的性質が変化しない物質を触媒と呼びます。 。

化学産業では、85% を超えるプロセスは反応速度を高めるために触媒に依存しています。その中で、新しい効率的な触媒を設計することが産業全体にとって重要であることは明らかです。最適な触媒を理解し決定する上で最も有益な特徴の 1 つは、触媒表面上の反応物の化学吸着エネルギー E です。広告 。化学反応は本質的に複雑であるため、E を明確に決定することが困難です。広告  重要な物理量には大きな困難があります。

最近、上海交通大学JI助教授の何玉蓮氏の研究グループは、トップクラスの国際総合誌「米国科学アカデミー紀要(PNAS)」に「化学吸着の解釈」と題する論文を発表した。 「研究論文「AutoML ベースの特徴削除実験による強度」。この研究は、E という決定を下すことを目的としています。広告  主要な物理量に対する新しい方法、すなわち自動機械学習 (AutoML) に基づく特徴削除実験を提案し、高スループット密度汎関数理論 (DFT) データベースからの知識の自動抽出を実現します。

研究のハイライト:

※自動機械学習(AutoML)による特徴削除実験により、高スループットの密度関数理論(DFT)データベースからの知識の自動抽出を実現

* この研究は、二元合金触媒の表面の吸着サイトの局所的な幾何学的情報が化学吸着エネルギー E に大きな影響を与えることを実証しています。広告  は重要な影響を及ぼし、AutoML ベースの特徴削除実験の安定性、一貫性、可能性を実証しています。

* この研究結果は触媒設計の最適化において非常に重要であり、方法論に重要な影響を与えます。

用紙のアドレス:
https://www.pnas.org/doi/10.1073/pnas.2320232121 

公式アカウントをフォローし、バックグラウンドで「Automatic Machine Learning」に返信すると、完全な PDF が入手できます

厳密で科学的な高品質のデータセット

ハイスループット密度汎関数理論によって計算された解離化学吸着エネルギーのデータセットが、この研究のベンチマークとして選択されました。データの品質は、Mamun et al. が提案したのと同じ DFT プロトコルを使用して吸着エネルギーを再現することで検証されました。

このデータベースには、二元合金表面上のさまざまな吸着物について DFT で計算された E が含まれています。広告  これらの吸着物は 37 種類の異なる金属元素で構成されています。その後、研究者らは、88,587 エントリを含むデータセットから 10 を超える吸着物が関与する化学吸着反応を選択し、5 つの二原子分子吸着剤 (H2 、お2 、N2 、CO および NO)、以下の表に示すように、合計 8,418 のエントリがあります。

この論文は二原子の化学吸着反応を研究しています。

吸着剤を二原子分子に制約することの主な目的は、吸着剤の構造によって生じる複雑さを軽減し、吸着剤の説明を統一して、機械学習モデルが関係する合金 (つまり、触媒) の表面挙動に焦点を当てることができるようにすることです。

自動機械学習 (AutoML) による知識抽出手法

これまで研究者は、触媒反応に関する新たな洞察を発見するために、機械学習 (ML) 手法、特に説明可能な人工知能 (XAI) を使用する傾向がありました。ただし、化学分野における AI テクノロジーの急速な発展に伴い、XAI が提供するモデルや特定の機能の説明は、化学研究者が要求する明確さと確実性のレベルを満たしていない可能性があります。したがって、この研究では、代替となる自動機械学習 (AutoML) による知識抽出アプローチを提案しています。以下に示すように:

研究概要

研究者らは、機械学習アルゴリズムの内部動作を深く掘り下げるのではなく、集合的な分析のために多くの比較可能な機械学習モデルをバンドルしました。具体的には、研究者らは、単純かつ基本的な原則に基づいて物理的洞察を構築しました。つまり、「重要な」物理量は物理モデルの予測可能性に大きな影響を与えるはずであり、したがって、これらの量を削除するとモデルの有効性が低下し、その逆も同様であるという仮説です。

最初のステップ、初期のベースライン特徴セット (Ftotal) が構築され、その記述性を保証するために検証され、この特徴セットを使用するモデルは許容可能な予測パフォーマンスを示すはずです。


ステップ2、内部相関のある特徴を Ftotal から削除して、モデルの予測可能性の変化を確認します。

このアプローチには 3 つの利点があります。

1. 物理的な洞察は、さまざまな機能セットのパフォーマンスを比較することによって収集され、物理的な考慮事項が明示的に組み込まれます。慎重に設計された実験設定を使用すると、予測可能性の変化を物理的な仮定に関連付けることができます。

2. 比較可能なモデルの統計を分析することにより、モデルのランダム性を低減します。

3. このアプローチでは、知識抽出プロセス中に機械学習アルゴリズムの詳細な数学的構造を理解することが回避されるため、モデルの複雑さと解釈可能性の間のトレードオフが回避されます。

研究結果:吸着サイトの局所幾何情報が重要な物理量

カスタマイズされた AutoML ベースの特徴削除実験を通じて、この研究により、二元合金触媒表面の場合、吸着サイトの局所的な幾何学的情報によって決定されることがわかりました。 E広告 合金触媒の固有の電子的特性や物理的および化学的特性ではなく、重要な物理量です。

具体的には、この研究では、特徴削除実験とニューラル ネットワーク ベースの説明可能な人工知能 (XAI) ツールであるインスタンス化変数選択 (INVASE) を組み合わせて、予測 E を要約しました。広告  最良の特徴セットには、21 個の非 DFT 計算固有物理量 F21 が含まれています。この機能セットを使用すると、1,600 以上の合金表面を含む約 8,400 回の化学吸着反応で、0.23 eV の平均絶対誤差 (MAE) が達成されました。

以下の表は、1 つの吸着機能、3 つの幾何学的特徴、7 つの物理化学的特徴、および 10 の電子的特徴を含む F21 の詳細情報を示しています。

貪欲スキャンで最高のパフォーマンスを発揮する機能セットの詳細

研究者らは、実証済みの特徴削除手法を Ftotal に適用し、F21 の幾何学的、物理化学的、電子的特徴の相対的な重要性を判断しました。結果を以下に示します。 F21 から電子的特徴を除去すると、ΔMAE ≈ 0.04 eV となり、MAE = 0.30 eV となり、Ftotal と同等になります。

F21の詳細分析

Ftotal と同様に、幾何学的特徴は 3 つだけ選択されますが、F21 では幾何学的情報が最も重要な役割を果たします。上の (b) に示すように、ΔMAE は約 0.4 eV です。上の図 (c) は、F21 から合金の物理的および化学的情報を削除すると、電子特性 (ΔMAE ≈ 0.15 eV) よりも大きな影響があることを示しています。特に、研究者らは、合金成分 B の特定の特徴である原子半径 B が特に重要であることを発見しました。削除順序に関係なく、原子半径 B が除去されると、約 0.1 eV の ΔMAE が観察されます。原子半径 B の重要性は、バイメタル ナノ結晶における「配位子」または「ひずみ」効果に関連している可能性があります。主金属マトリックス A への第 2 金属 B の導入は、電子状態および/または格子歪み (圧縮または引張) に大きな変化を引き起こし、化学吸着強度に影響を与える可能性があります。

上の図 (d) に要約されているように、F21 で見られる相対的な重要性の順序は、幾何学 > 物理化学 > 電子工学であり、Ftotal の調査結果と一致しています。

要約すると、この研究は、二元合金触媒の表面上の吸着サイトの局所的な幾何学的情報が化学吸着エネルギー E に大きな影響を与えることを示しています。広告  は重要な影響を及ぼし、AutoML ベースの特徴削除実験の安定性、一貫性、可能性を実証しています。従来の解釈可能性モデルと比較して、この方法はモデルの複雑さと解釈可能性の間のトレードオフを回避し、科学的洞察のソースをモデルの動作の解明から特徴セットのパフォーマンスの評価に移し、結論に対する人間の干渉の影響を最小限に抑え、知識を抽出します。出力の統計的動作。

この新しく提案された AutoML ベースの特徴分析手法は、触媒の分野を超えて、複雑な物理科学における統計的特徴の重要性を明らかにするための強力かつ柔軟なツールです。

触媒分野は効率的な未来に向けて進む

新しい触媒の設計は、エネルギーと環境の多くの課題を解決する鍵となります。しかし、一方で、多くの触媒反応には、複数の中間体や遷移状態の生成と変換を含む複雑な反応機構が含まれており、これらの反応機構は溶媒、温度、圧力などの複数の要因の影響を受ける可能性があり、予測が可能です。その一方で、触媒合成の複雑さと不確実性により、試行錯誤のコストが高くつくことが多く、従来の方法では多くの異なる材料と反応条件を試す必要がある場合があります。これにより、触媒の開発時間とコストが増加します。

これらの課題を克服し、新しい触媒の設計効率と性能を向上させるには、人工知能技術を導入する必要があります。人工知能は、ビッグデータと機械学習アルゴリズムを使用して、複雑な触媒反応メカニズムを分析し、触媒の設計と最適化プロセスを加速できます。例えば:

* 結晶構造の予測と設計:人工知能を使用して触媒の結晶構造を予測および設計し、触媒性能を向上させることができます。かつて、科学者は既知の結晶を調整したり、新しい元素の組み合わせを実験したりすることで新しい結晶構造を発見していましたが、現在ではディープラーニングなどのテクノロジーにより、大量の結晶構造データを分析し、触媒設計の指針となるパターンや傾向を発見することができます。

* 化学反応の予測と最適化:人工知能は、化学反応の生成物と反応経路を予測し、反応条件を最適化して望ましい触媒効果を達成するのに役立ちます。たとえば、ニューラル ネットワーク モデルをトレーニングすることで、科学者は反応メカニズムの予測モデルを確立し、それに応じて実験計画を導くことができます。

* ハイスループットの材料スクリーニング:人工知能は、ハイスループットの材料スクリーニングプロセスを加速し、多数の候補材料の中から潜在的な触媒特性を持つ候補を迅速に特定できます。

* インテリジェントな実験計画と最適化:人工知能は、触媒合成の効率とパフォーマンスを最大化するための実験プロトコルの設計と最適化に役立ちます。機械学習と自動実験技術を組み合わせることで、実験プロセスを自動的に実行し、リアルタイムデータに基づいて調整および最適化するインテリジェントな実験プラットフォームを構築できます。

たとえば、2023 年 9 月、北海道大学の研究者らは、新しい多元素逆水性ガスシフト触媒を開発するための外挿機械学習手法を実証しました。 45 個の触媒を初期データ ポイントとして使用し、閉ループ発見システム (ML 予測 + 実験) を 44 サイクル実行することで、研究者らは合計 300 個の触媒を実験的にテストし、以前に報告された高触媒との比較に関連する 100 個以上の触媒を特定しました。パフォーマンス触媒を使用すると、活性が向上します。

この研究は「外挿機械学習アプローチを使用した多元素逆水ガスシフト触媒の発見の加速」と題され、Nature Communications に掲載されました。

将来的には、人工知能により触媒の設計と合成の効率がさらに向上し、新しい触媒の発見と応用が加速され、それによって化学分野の発展が促進されることが期待されています。

参考文献:
1.http://www.sdqiying.com/cxinwenz/469/
2.https://www.zhihuiya.com/newknowledge/info_2859.html
3.https://www.ceshigo.com/article/11511.html
4.https://www.jiqizhixin.com/articles/2023-10-21-19