En Accélérant La Conception Des Catalyseurs, Le Groupe De Recherche De He Yulian À L'université Jiaotong De Shanghai Extrait Automatiquement Des Connaissances Basées Sur AutoML

Dans la vie quotidienne, la « catalyse » est l’une des réactions chimiques les plus courantes. Par exemple, l’essence de la fabrication du vin et du vinaigre est le processus dans lequel l’amidon des céréales est transformé en alcool et en acide acétique sous la catalyse d’enzymes microbiennes.
Pour le dire en termes plus académiques, une substance qui peut modifier la vitesse de réaction des réactifs dans une réaction chimique (l'augmenter ou la diminuer) sans modifier l'équilibre chimique, et dont la masse et les propriétés chimiques ne changent pas avant et après la réaction chimique est appelée un catalyseur.
Dans l’industrie chimique, les procédés supérieurs à 85% reposent tous sur des catalyseurs pour accélérer la vitesse de réaction. L’importance de concevoir des catalyseurs nouveaux et efficaces pour l’ensemble de l’industrie est évidente.Dans le processus de compréhension et d’identification du meilleur catalyseur, l’une des caractéristiques les plus informatives est l’énergie d’adsorption chimique E des réactifs sur la surface du catalyseur.publicités . Les réactions chimiques sont intrinsèquement complexes, ce qui rend difficile la détermination claire de Epublicités Il existe des difficultés importantes pour déterminer les quantités physiques clés.
Récemment, le groupe de recherche du professeur adjoint Yulian He de l'Institut conjoint de l'Université Jiao Tong de Shanghai a publié un article de recherche intitulé « Interprétation de la force de chimisorption avec des expériences de suppression de fonctionnalités basées sur AutoML » dans la revue internationale complète de premier plan Proceedings of the National Academy of Sciences of the United States of America (PNAS).Cette étude vise à déterminer la décisionpublicités Une nouvelle méthode est proposée pour l'extraction automatique de connaissances à partir d'une base de données de théorie fonctionnelle de densité (DFT) à haut débit basée sur des expériences de suppression de fonctionnalités basées sur l'apprentissage automatique automatisé (AutoML).
Points saillants de la recherche :
* Expériences de suppression de fonctionnalités basées sur l'apprentissage automatique automatisé (AutoML) pour extraire automatiquement des connaissances à partir de bases de données de théorie fonctionnelle de densité (DFT) à haut débit
* L'étude démontre que les informations géométriques locales des sites d'adsorption à la surface des catalyseurs en alliage binaire ont une influence importante sur l'énergie d'adsorption chimique Epublicités L'impact significatif des expériences de suppression de fonctionnalités AutoML démontre la stabilité, la cohérence et le potentiel de
* Ce résultat de recherche est d’une grande importance dans l’optimisation de la conception des catalyseurs et a un impact significatif sur la méthodologie

Adresse du document :
https://www.pnas.org/doi/10.1073/pnas.2320232121
Suivez le compte officiel et répondez « Automatic Machine Learning » pour obtenir le PDF complet
Des ensembles de données de haute qualité avec une science rigoureuse
Un ensemble de données d'énergie de chimisorption dissociative calculée par la théorie fonctionnelle de la densité à haut débit a été sélectionné comme référence dans cette étude. La qualité des données a été vérifiée en reproduisant les énergies d'adsorption en utilisant le même protocole DFT suggéré par Mamun et al.
Cette base de données contient les valeurs E calculées par DFT de divers adsorbats sur des surfaces d'alliages binaires.publicités Les adsorbats sont composés de 37 éléments métalliques différents. Les chercheurs ont ensuite sélectionné des réactions d'adsorption chimique impliquant plus de 10 adsorbats à partir d'un ensemble de données contenant 88 587 entrées, en ne conservant que cinq adsorbants moléculaires diatomiques (H2 , O2 , N2 , CO et NO), comme indiqué dans le tableau suivant, totalisant 8 418 entrées.

L’objectif principal de la restriction des adsorbants aux molécules diatomiques est de réduire la complexité causée par la structure de l’adsorbant et d’unifier la description de l’adsorbant afin que le modèle d’apprentissage automatique puisse se concentrer sur le comportement de surface de l’alliage impliqué (c’est-à-dire le catalyseur).
Méthodes d'extraction de connaissances guidées par l'apprentissage automatique (AutoML)
Auparavant, les chercheurs avaient tendance à utiliser des méthodes d’apprentissage automatique (ML), en particulier l’intelligence artificielle explicable (XAI), pour découvrir de nouvelles perspectives sur les réactions catalytiques. Cependant, avec le développement rapide de la technologie de l’IA dans le domaine de la chimie, les modèles et les explications de caractéristiques spécifiques fournis par XAI peuvent ne pas être en mesure de répondre au niveau de clarté et de certitude requis par les chercheurs en chimie. donc,Cette étude propose une alternative, à savoir une approche d’extraction de connaissances guidée par l’apprentissage automatique automatisé (AutoML).Comme indiqué ci-dessous :

Plutôt que de se plonger dans le fonctionnement interne des algorithmes d’apprentissage automatique, les chercheurs ont regroupé de nombreux modèles d’apprentissage automatique comparables pour une analyse collective. Plus précisément, les chercheurs ont fondé leurs connaissances en physique sur un principe simple mais fondamental : l’hypothèse selon laquelle les quantités physiques « critiques » devraient affecter de manière significative la prévisibilité des modèles physiques ; par conséquent, supprimer ces quantités réduirait l’efficacité du modèle, et vice versa.
premier pas, un ensemble initial de fonctionnalités de référence (Ftotal) est construit et validé pour garantir sa descriptivité, et les modèles utilisant cet ensemble de fonctionnalités devraient montrer des performances prédictives acceptables.
Étape 2, supprimez les fonctionnalités corrélées en interne de Ftotal pour examiner tout changement dans la prévisibilité du modèle.
Cette approche présente trois avantages :
1. Les informations physiques sont recueillies en comparant les performances de différents ensembles de fonctionnalités, intégrant ainsi explicitement des considérations physiques. Grâce à des configurations expérimentales soigneusement conçues, les changements de prévisibilité peuvent être liés à des hypothèses physiques ;
2. Réduire le caractère aléatoire du modèle en analysant les statistiques de modèles comparables ;
3. Cette approche évite de comprendre la structure mathématique détaillée des algorithmes d’apprentissage automatique pendant le processus d’extraction des connaissances, évitant ainsi le compromis entre la complexité du modèle et son interprétabilité.
Résultats de la recherche : Les informations géométriques locales des sites d'adsorption constituent la quantité physique clé
Grâce à des expériences de suppression de fonctionnalités personnalisées basées sur AutoML,Cette étude a révélé que pour les surfaces de catalyseurs en alliage binaire, les informations géométriques locales du site d'adsorption sont le facteur clé déterminant la Epublicités La quantité physique clé n’est pas les propriétés électroniques ou physicochimiques intrinsèques du catalyseur d’alliage.
Plus précisément, l'étude a combiné des expériences de suppression de caractéristiques avec l'outil d'intelligence artificielle explicable (XAI) basé sur un réseau neuronal, la sélection de variables instanciées (INVASE) pour résumer la prédiction de Epublicités Le meilleur ensemble de fonctionnalités contient 21 quantités physiques intrinsèques non calculées par DFT F21. Grâce à cet ensemble de fonctionnalités, une erreur absolue moyenne (MAE) de 0,23 eV a été obtenue pour environ 8 400 réactions d'adsorption chimique sur plus de 1 600 surfaces d'alliage.
Le tableau ci-dessous présente les informations détaillées du F21, y compris 1 caractéristique adsorbante, 3 caractéristiques géométriques, 7 caractéristiques physico-chimiques et 10 caractéristiques électroniques.

Les chercheurs ont appliqué une méthode de suppression de caractéristiques validée à Ftotal et ont déterminé l’importance relative des caractéristiques géométriques, physicochimiques et électroniques de F21. Les résultats sont présentés dans la figure ci-dessous : La suppression des caractéristiques électroniques de F21 donne ΔMAE ≈ 0,04 eV, ce qui rend MAE = 0,30 eV, comparable à Ftotal.

Similaire à Ftotal, bien que seules trois caractéristiques géométriques soient sélectionnées, les informations géométriques jouent le rôle le plus critique dans F21, comme le montre la figure (b) ci-dessus, avec un ΔMAE d'environ 0,4 eV. La figure (c) ci-dessus montre que la suppression des informations physico-chimiques de l'alliage du F21 a un impact plus important que les caractéristiques électroniques (ΔMAE ≈ 0,15 eV). En particulier, les chercheurs ont découvert qu’une caractéristique spécifique du composant d’alliage B, le rayon atomique B, était particulièrement importante. Quel que soit l'ordre de suppression, un ΔMAE d'environ 0,1 eV a été observé lorsque le rayon atomique B a été supprimé. L’importance du rayon atomique B peut être liée à l’effet « ligand » ou « contrainte » dans les nanocristaux bimétalliques. L'introduction d'un métal secondaire B dans la matrice métallique primaire A peut induire des changements significatifs dans l'état électronique et/ou la contrainte du réseau (compression ou tension), affectant ainsi la force d'adsorption chimique.
Comme résumé dans la figure (d) ci-dessus, l’importance relative trouvée sur F21 est classée comme géométrique > physicochimique > électronique, cohérente avec les résultats de Ftotal.
En résumé, cette étude démontre que les informations géométriques locales des sites d'adsorption sur les surfaces des catalyseurs en alliage binaire ont une influence significative sur l'énergie d'adsorption chimique Epublicités Les résultats montrent l’impact significatif de la suppression de fonctionnalités sur le modèle, démontrant la stabilité, la cohérence et le potentiel des expériences de suppression de fonctionnalités basées sur AutoML. Par rapport aux modèles interprétables traditionnels, cette méthode évite le compromis entre la complexité et l'interprétabilité du modèle, déplace la source des connaissances scientifiques de l'élucidation du comportement du modèle vers l'évaluation des performances de l'ensemble des fonctionnalités, minimise l'impact de l'interférence humaine sur les conclusions et extrait les connaissances du comportement statistique de la sortie.
Cette nouvelle méthode d’analyse de caractéristiques basée sur AutoML est un outil puissant et flexible pour révéler l’importance des caractéristiques statistiques dans les sciences physiques complexes, même au-delà du domaine de la catalyse.
Catalyse vers un avenir efficace
La conception de nouveaux catalyseurs est essentielle pour résoudre de nombreux défis énergétiques et environnementaux. Cependant, d’une part, de nombreuses réactions catalytiques impliquent des mécanismes réactionnels complexes, notamment la génération et la transformation de multiples intermédiaires et états de transition. Ces mécanismes de réaction peuvent être affectés par de nombreux facteurs, tels que les solvants, la température, la pression, etc., ce qui rend très difficile la prédiction et la compréhension des performances des catalyseurs ; d’autre part, en raison de la complexité et de l’incertitude de la synthèse des catalyseurs, le coût des essais et des erreurs est souvent élevé. Les méthodes traditionnelles peuvent nécessiter d’essayer une variété de matériaux et de conditions de réaction différents, ce qui augmente le temps et le coût du développement du catalyseur.
Pour surmonter ces défis et améliorer l’efficacité de conception et les performances des nouveaux catalyseurs, des techniques d’intelligence artificielle doivent être introduites. L’intelligence artificielle peut utiliser le Big Data et les algorithmes d’apprentissage automatique pour analyser des mécanismes de réaction catalytique complexes et accélérer le processus de conception et d’optimisation des catalyseurs. Par exemple:
* Prédiction et conception de la structure cristalline :L’intelligence artificielle peut être utilisée pour prédire et concevoir la structure cristalline des catalyseurs, améliorant ainsi les performances catalytiques. Dans le passé, les scientifiques recherchaient de nouvelles structures cristallines en ajustant des cristaux connus ou en essayant de nouvelles combinaisons d’éléments. Désormais, des technologies telles que l’apprentissage profond peuvent analyser de grandes quantités de données sur la structure cristalline et découvrir des modèles et des tendances pour guider la conception des catalyseurs.
* Prédiction et optimisation des réactions chimiques :L’intelligence artificielle peut aider à prédire les produits et les voies de réaction des réactions chimiques et à optimiser les conditions de réaction pour obtenir l’effet catalytique souhaité. Par exemple, en formant des modèles de réseaux neuronaux, les scientifiques peuvent établir des modèles prédictifs des mécanismes de réaction et les utiliser pour guider la conception expérimentale.
* Criblage de matériaux à haut débit :L’intelligence artificielle peut accélérer le processus de criblage des matériaux à haut débit et identifier rapidement les candidats dotés de propriétés catalytiques potentielles parmi un grand nombre de matériaux candidats.
* Conception et optimisation d'expériences intelligentes :L’intelligence artificielle peut aider à concevoir et à optimiser les protocoles expérimentaux pour maximiser l’efficacité de la synthèse et les performances des catalyseurs. En combinant l’apprentissage automatique et la technologie d’expérimentation automatisée, une plate-forme d’expérimentation intelligente peut être construite pour exécuter automatiquement des processus expérimentaux et effectuer des ajustements et des optimisations en fonction de données en temps réel.
Par exemple, en septembre 2023, des chercheurs de l’Université d’Hokkaido ont démontré une approche d’apprentissage automatique extrapolée pour développer de nouveaux catalyseurs de conversion inverse eau-gaz à plusieurs éléments. En utilisant 45 catalyseurs comme points de données initiaux et en effectuant 44 cycles d'un système de découverte en boucle fermée (prédiction ML + expérience), les chercheurs ont testé expérimentalement un total de 300 catalyseurs et identifié plus de 100 catalyseurs qui avaient une activité supérieure par rapport aux catalyseurs haute performance précédemment rapportés.
La recherche, intitulée « Découverte accélérée de catalyseurs de décalage inverse eau-gaz multi-élémentaires à l'aide d'une approche d'apprentissage automatique extrapolatif », a été publiée dans Nature Communications.

À l’avenir, l’intelligence artificielle devrait améliorer encore la conception et l’efficacité de la synthèse des catalyseurs, accélérer la découverte et l’application de nouveaux catalyseurs et ainsi favoriser le développement du domaine de la chimie.
Références :
1.http://www.sdqiying.com/cxinwenz/469/
2.https://www.zhihuiya.com/newknowledge/info_2859.html
3.https://www.ceshigo.com/article/11511.html
4.https://www.jiqizhixin.com/articles/2023-10-21-19