HyperAIHyperAI

Les Modèles Multimodaux Accélèrent La Mise En Correspondance De Nouveaux Matériaux Avec Des Applications Industrielles, En Prédisant Les Propriétés Des Matériaux Sans Avoir Besoin d'une Structure Cristalline complète.

特色图像

Les oranges cultivées au sud de la rivière Huai deviennent des oranges, tandis que celles cultivées au nord deviennent des mandarines. Une même graine plantée dans des sols et des climats différents donne des fruits très différents. Cette loi naturelle de la croissance est également évidente en chimie des matériaux : les nouveaux matériaux présentent des performances variables selon les applications. Les recherches indiquent que les scientifiques créent des centaines de milliers de nouveaux matériaux chaque année. Ceux-ci sont comme d'innombrables « graines » au potentiel immense qui doivent être enracinées dans un environnement propice pour s'épanouir.

Bien que les nouveaux matériaux actuels soient souvent synthétisés pour des applications spécifiques, ils ont souvent des applications potentielles dans différents domaines. Cependant, déterminer rapidement les scénarios d'application de ces nouveaux matériaux reste un défi.Prenons l'exemple des matériaux cristallins métallo-organiques (MOF), largement utilisés. Leur application la plus notable est le stockage de gaz tels que l'hydrogène et le méthane, et ils présentent un excellent potentiel de performance dans les membranes, les dispositifs à couches minces, la catalyse et l'imagerie biomédicale. Les approches traditionnelles pour déterminer l'application optimale des MOF s'appuient sur les propriétés des matériaux comme base intermédiaire, mais les tests sont coûteux (en termes de temps, d'équipement et d'expertise). De plus, les méthodes de criblage informatique et d'apprentissage automatique nécessitent la structure cristalline complète pour prédire les propriétés, mais l'analyse de la structure cristalline est chronophage et difficilement disponible après la synthèse des MOF.

Pour résoudre ce problème, une équipe de recherche du Département de génie chimique et de chimie appliquée de l’Université de Toronto, au Canada, a proposé une nouvelle méthode basée sur un modèle d’apprentissage automatique multimodal.En utilisant les informations disponibles après la synthèse des MOF pour prédire leurs propriétés et utilisations potentielles,Par exemple, le modèle inclut les diagrammes de diffraction des rayons X sur poudre (PXRD) et les produits chimiques utilisés dans sa synthèse. L'équipe de recherche a ajouté au modèle un système de recommandation d'applications, qui fournit des suggestions d'application immédiatement après la synthèse des MOF. Cette recherche accélère le lien entre la synthèse des structures organométalliques (MOF) et leurs scénarios d'application.

La recherche connexe a été publiée dans Nature Communications sous le titre « Connecter la synthèse de structures métallo-organiques aux applications utilisant l'apprentissage automatique multimodal ».

Points saillants de la recherche :

* Cette méthode utilise uniquement les informations disponibles après la synthèse pour prédire les propriétés et les utilisations potentielles des MOF, en faisant des recommandations d'application immédiatement après la synthèse des MOF, raccourcissant considérablement le cycle de synthèse du matériau à l'application ;

Les performances de prédiction du modèle sont comparables à celles des modèles avancés nécessitant des données précises sur la structure cristalline (par exemple, CGCNN et MOFormer), et les surpassent même dans certaines conditions. Il est également stable et fiable face au bruit expérimental, aux défauts de structure cristalline et à d'autres conditions, démontrant ainsi une excellente robustesse.

* Cette étude combine un système de recommandation d’application visuelle pour construire un système en boucle fermée de synthèse-prédiction-application ;

Adresse du document :

https://www.nature.com/articles/s41467-025-60796-0

Suivez le compte officiel et répondez « MOFs » pour obtenir le PDF complet

Autres articles sur les frontières de l'IA : https://hyper.ai/papers

« Les données sont le site de synthèse » : la stratégie de construction de données MOF pour la prédiction des applications

Dans cette étude, un total de 6 bases de données de structures organométalliques (MOF) ont été utilisées pour la formation et l'évaluation du modèle : sous-ensembles CoRE-2019, BW20K, ARABG, QMOF, hMOF et CSD.dans:

* hMOF fournit une bibliothèque extrêmement vaste de structures hypothétiques, ce qui contribue à améliorer la capacité de généralisation du modèle.

* BW20K et ARABG sont utilisés pour améliorer la diversité et prendre en charge les tâches à quelques prises de vue.

* Le sous-ensemble CSD est utilisé pour tester la robustesse du modèle sous biais expérimental.

L'équipe de recherche a utilisé les structures cristallines des bases de données CoRE 2019, BW20K, ARABG, QMOF et hMOF, et a calculé des modèles PXRD simulés de 0 à 90 degrés à l'aide du module XRD de pymatgen afin de simuler les informations de caractérisation structurale obtenues après synthèse lors d'expériences réelles. Les informations sur les précurseurs chimiques, composés de nœuds métalliques et de lieurs organiques, ont été construites au format [type de métal].[lieur organique], qui a été introduit dans le canal Transformer du modèle pour la segmentation des mots.

Un cadre d'apprentissage multimodal basé sur une pré-formation auto-supervisée

L'équipe de recherche a proposé un cadre d'apprentissage multimodal auto-supervisé basé sur une pré-formation, visant à éliminer la dépendance à la structure cristalline complète.Prédire les propriétés et les applications potentielles des MOF en utilisant uniquement les informations disponibles après la synthèse.

Le flux de travail de ce modèle multimodal auto-supervisé est illustré dans la figure ci-dessous. Une chaîne de précurseurs et un spectre de diffraction des rayons X sur poudre (PXRD) sont utilisés comme entrées, intégrés respectivement via un transformateur et un réseau neuronal convolutif (CNN), puis transmis à une tête de régression pour un réglage fin. Le précurseur fournit des informations sur les propriétés chimiques du matériau, tandis que le spectre PXRD fournit des informations supplémentaires sur la structure géométrique globale.

Les chaînes de précurseurs chimiques codées par Transformer et les spectres PXRD traités par CNN sont construits dans un espace de représentation unifié grâce à l'épissage et à la projection de caractéristiques.Pour pallier la déficience du « précurseur + PXRD » qui ne permet pas de caractériser directement l’environnement chimique local, l’équipe de recherche a introduit un mécanisme de pré-formation auto-supervisé.La sortie du modèle est alignée sur l'intégration du réseau neuronal convolutif à graphe cristallin (CGCNN), et la matrice de corrélation croisée est contrainte d'être proche de la matrice d'identité via la perte des jumeaux de Barlow, guidant ainsi le modèle pour apprendre le pouvoir expressif de l'environnement chimique local.

Sur cette base, après une formation auto-supervisée sur des données non étiquetées à grande échelle, le modèle peut converger rapidement avec des échantillons étiquetés limités et réaliser des prédictions de haute précision de la structure des pores, des caractéristiques de dépendance chimique et des propriétés chimiques quantiques.

Flux de travail des modèles multimodaux auto-supervisés

Plus précisément, sur la base des structures cristallines obtenues à partir de la base de données MOF,Même avec de petites quantités de données, cette méthode peut prédire avec précision diverses caractéristiques.Il s’agit notamment de la structure des pores, des propriétés chimiquement dépendantes et des propriétés chimiques quantiques.

Durant la phase d'auto-supervision et d'apprentissage, un pipeline d'apprentissage auto-supervisé (SSL) a été construit pour effectuer l'apprentissage des représentations entre le réseau neuronal convolutif Crystal Graph (CGCNN) et le modèle, surmontant ainsi la limitation du modèle, incapable de comprendre l'environnement local du MOF à partir de ses entrées. Les pondérations du modèle ont été initialisées, permettant une convergence rapide vers une solution. L'apprentissage auto-supervisé a été effectué sur les plongements du CGCNN. Chaque plongement de taille 512 a été extrait du CGCNN et du projecteur du modèle, et une matrice de corrélation croisée de forme (512, 512) a été construite. La fonction de perte Barlow-Twin a été utilisée pour minimiser la différence, rapprochant la matrice de corrélation croisée de la matrice d'identité, réalisant ainsi l'apprentissage des représentations.

Évaluation des modèles multimodaux

Pour prouver que le modèle peut prédire efficacement diverses propriétés des MOF et jeter les bases de la combinaison de la synthèse et de l'application des MOF, l'équipe de recherche a évalué la précision du modèle, en utilisant le coefficient de corrélation de rang de Spearman (SRCC) et l'erreur absolue moyenne (MAE) pour évaluer la précision de prédiction du modèle dans les propriétés géométriquement dépendantes, les propriétés chimiquement dépendantes et les propriétés chimiques quantiques, et a effectué des comparaisons de référence avec CGCNN, MOFormer et les modèles d'apprentissage automatique basés sur des descripteurs.

Les résultats montrent queLa précision du modèle est comparable à celle des modèles s'appuyant sur la structure cristalline complète.Il surpasse même CGCNN et MOFormer en termes de performances géométriques, vérifiant ainsi qu'une prédiction de propriétés de haute précision peut être obtenue en utilisant uniquement des informations de synthèse, posant ainsi une base expérimentale pour l'adaptation rapide de la synthèse MOF à l'application.

Performances du modèle dans diverses tâches de prédiction d'attributs

De plus, l'équipe a mené des expériences d'ablation, comparant des modèles reposant uniquement sur des précurseurs chimiques et des modèles reposant uniquement sur la PXRD avec le modèle multimodal développé dans cette étude. Les résultats ont montré que le modèle acceptant uniquement les précurseurs chimiques en entrée ne parvenait pas à capturer efficacement la structure globale du MOF, obtenant de mauvais résultats sur les propriétés géométriques et purement géométriques. Alors que le modèle acceptant uniquement la PXRD capturait bien la structure globale du MOF, il ne reflétait pas l'environnement local, ce qui se traduisait par de mauvais résultats sur les propriétés chimiques et quantiques (telles que l'adsorption de CO₂ à basse pression et la bande interdite). Les deux modèles présentaient des limites. Les résultats démontrent que seule la combinaison de la PXRD (qui fournit des informations géométriques) et de la chaîne de précurseurs (qui fournit des informations chimiques) permet au modèle multimodal d'obtenir des prédictions complètes et précises pour les trois catégories de propriétés ; l'utilisation de l'une ou l'autre modalité seule est clairement moins performante.

Vérification de la stabilité du modèle : évaluation de la robustesse face aux erreurs structurelles et au bruit expérimental

La stabilité est une mesure importante pour évaluer la fiabilité d'un modèle d'apprentissage automatique dans des scénarios réels. À cette fin, l'équipe de recherche a systématiquement évalué la robustesse du modèle multimodal proposé dans des conditions non idéales. Dans un premier temps, les chercheurs ont utilisé des structures cristallines expérimentales extraites de la Cambridge Structural Database (CSD) pour calculer les modèles PXRD correspondants afin de simuler des écarts structurels courants dans des expériences réelles, tels que l'absence d'atomes d'hydrogène et la présence de solvant lié ou non lié. L'évaluation s'est concentrée sur une seule propriété géométrique : la prédiction de la capacité d'adsorption du méthane sous haute pression pour les applications de stockage du méthane.

Les résultats montrent queLe modèle peut toujours conserver une bonne capacité prédictive dans les conditions de variation ci-dessus.Le classement des performances d'adsorption haute pression de CH₄ présente une forte cohérence et l'erreur relative est contrôlée en dessous de 13%, montrant une grande robustesse.

Sur cette base, l'équipe a ensuite introduit des modèles PXRD mesurés pour les tester afin de vérifier la stabilité du modèle face à des erreurs de mesure réelles telles que le bruit de l'instrument et les fluctuations de température. Bien qu'il existe des différences significatives entre les modèles simulés et expérimentaux dans certains échantillons, le modèle fournit des résultats recommandés proches des modèles simulés dans la plupart des cas, et ne diffère que dans des cas individuels présentant un bruit important ou un désalignement évident des pics. Combiné aux expériences ci-dessus, il montre que le modèle multimodal présente non seulement une grande précision de prédiction dans des conditions d'entrée structurelles idéales, mais qu'il conserve également des performances robustes lorsque la structure expérimentale est imparfaite ou que le PXRD est bruyant.Sa large applicabilité dans la recherche et les applications pratiques sur les matériaux a été vérifiée.

La figure ci-dessous montre les résultats de recommandation du modèle, en comparant les différences entre les modèles PXRD simulés et les modèles PXRD expérimentaux :

Comparaison des modèles PXRD simulés et des modèles PXRD expérimentaux

Système de recommandation intégré synthèse-application

Forts des performances impressionnantes du modèle, les chercheurs ont développé un système visuel de recommandation d'applications potentielles qui associe les MOF nouvellement synthétisés à des applications potentielles (telles que le stockage de gaz et la capture de carbone) en fonction des propriétés prédites des matériaux. Grâce à la technologie t-SNE, le système projette l'espace latent du modèle modal et utilise la couleur pour représenter les applications recommandées pour les MOF. La figure suivante illustre la correspondance entre les informations de synthèse et les scénarios d'application :

Pour vérifier la capacité du modèle à prédire les futures applications des matériaux, les chercheurs ont mené une expérience de voyage dans le temps.Le modèle a été entraîné à l'aide des entrées CoRE-2019 stockées dans la base de données CSD avant 2017, et testé à l'aide d'entrées stockées après 2017 afin de simuler les prédictions pour les matériaux futurs. L'objectif de l'expérience était de prédire les performances de ces MOF dans une application spécifique : l'adsorption du dioxyde de carbone. Les résultats ont montré que le modèle a identifié 18 MOF présentant un potentiel de capture du carbone, dont 15 initialement conçus pour d'autres applications.


Certains de ces MOF et leurs applications synthétiques attendues en fonction des

L'apprentissage automatique révolutionne la science des matériaux

Cet article présente une approche d'apprentissage automatique multimodal qui prédit avec précision les diverses propriétés des MOF et les adapte à des applications spécifiques, quelle que soit leur structure cristalline. Cette tendance, basée sur les données, se répand dans un plus large éventail de systèmes de matériaux, tant dans le temps que dans l'espace. Par exemple, l'équipe dirigée par Xie Jianxin et Su Yanjing de l'Université des sciences et technologies de Pékin a exploré l'application de l'apprentissage automatique interprétable en science des matériaux. Ils ont démontré que la combinaison de la connaissance des matériaux et de l'apprentissage automatique peut améliorer significativement la généralisation et la précision prédictive du modèle, ouvrant ainsi de nouvelles perspectives pour le développement de la science des matériaux. La recherche connexe, intitulée « Applications d'apprentissage automatique interprétables : une perspective prometteuse de l'IA pour les matériaux », a été publiée dans Advanced Functional Materials.

Adresse du document :

https://advanced.onlinelibrary.wiley.com/doi/abs/10.1002/adfm.202507734

Une équipe de recherche du Laboratoire national d'Argonne, aux États-Unis, a proposé un cadre d'IA générative, GHP-MOFsassemble, capable de générer et d'assembler aléatoirement de nouvelles structures MOF. Ce cadre utilise des simulations de dynamique moléculaire pour sélectionner des MOF hautement stables et utilise un réseau neuronal convolutif à graphes cristallins (CGCNN) et des simulations de Monte Carlo grand canonique pour tester la capacité d'adsorption de dioxyde de carbone des MOF. La recherche connexe, intitulée « Un cadre d'intelligence artificielle générative basé sur un modèle de diffusion moléculaire pour la conception de structures organométalliques pour la capture du carbone », a été publiée dans Communications Chemistry.

Adresse du document :

https://www.nature.com/articles/s42004-023-01090-2

Une équipe de recherche de l'Université d'Oxford a publié une étude intitulée « L'état amorphe, frontière de la conception computationnelle des matériaux », soulignant le rôle crucial de l'apprentissage automatique pour dépasser les limites traditionnelles de la conception des matériaux. L'étude démontre comment les avancées récentes en modélisation computationnelle et en intelligence artificielle peuvent combler le lien jusqu'alors manquant entre la structure à l'échelle atomique, les propriétés microscopiques et la fonctionnalité macroscopique des solides amorphes.

Adresse du document :

https://www.nature.com/articles/s41578-024-00754-2

Cette série d'études dresse un tableau clair : la science des matériaux entre dans une nouvelle ère d'intelligence, et nous sommes au cœur d'une transformation de la recherche sur les matériaux, portée par l'apprentissage automatique. Plus important encore, l'intelligence s'est progressivement étendue de la conception et de la synthèse de nouveaux matériaux aux scénarios d'application, ce qui ne manquera pas de favoriser leur mise en œuvre.

Références :

1.https://pubs.acs.org/doi/10.1021/cr300014x

Obtenez des articles de haute qualité et des articles d'interprétation approfondis dans le domaine de l'IA4S de 2023 à 2024 en un seul clic⬇️

 

Les Modèles Multimodaux Accélèrent La Mise En Correspondance De Nouveaux Matériaux Avec Des Applications Industrielles, En Prédisant Les Propriétés Des Matériaux Sans Avoir Besoin d'une Structure Cristalline complète. | Actualités | HyperAI