Concevez Directement Les Matériaux D'attributs Cibles ! Le Modèle MatterGen De Microsoft Est Désormais Open Source, Redéfinissant Le Nouveau Paradigme De La Conception Inversée Des Matériaux Avec L'ia Générative

En décembre 2023, Google DeepMind a publié son modèle d'apprentissage profond GNoME dans le domaine de la chimie des matériaux dans « Nature », affirmant avoir découvert 2,2 millions de nouvelles structures cristallines de matériaux inorganiques. Moins d'une semaine après cette avancée, Microsoft a annoncé le lancement de MatterGen, un modèle d'IA générative pour la conception de matériaux inversés, et a annoncé à tout le monde :À l’avenir, il sera possible de concevoir directement la structure de nouveaux matériaux en fonction des propriétés requises.

Si le modèle GNoME de Google nous montre que l'IA a le potentiel de découvrir rapidement de nouveaux matériaux dans un vaste espace chimique, alors MatterGen de Microsoft démontre davantage la capacité de l'IA générative à répondre avec précision à des besoins spécifiques grâce à la conception inversée. Ces deux projets démontrent différents points d’entrée de l’IA dans le domaine de la chimie des matériaux et marquent également un nouveau bond technologique de la découverte à grande échelle à la « conception à la demande ». Le 16 janvier, les résultats de MatterGen ont finalement été publiés dans Nature sous le titre « Un modèle génératif pour la conception de matériaux inorganiques ». Ce qui est encore plus excitant, c’est que le modèle est désormais open source.HyperAI a lancé le tutoriel « MatterGen Inorganic Material Design Model Demo » sur son site officiel. Il peut être déployé et exécuté en un clic. Tout le monde est invité à tester les performances du modèle.
Adresse du tutoriel :https://go.hyper.ai/5mWaL

Le professeur Wang Jinlan de l'Université du Sud-Est a souligné un jour dans l'article « Conception inverse avec des modèles génératifs profonds : prochaine étape dans la découverte des matériaux » que dans la recherche traditionnelle sur la conception de matériaux assistée par l'apprentissage automatique, la plupart d'entre eux prédisent les propriétés des matériaux candidats dans l'ensemble de l'espace chimique et effectuent un criblage à grande échelle pour trouver des matériaux potentiels avec les performances cibles, mais la conception inverse peut générer directement des composés qualifiés le long du chemin optimal. Elle estime que les modèles génératifs constituent une stratégie efficace pour la conception inverse des matériaux, ce qui coïncide avec les recherches de Microsoft.
MatterGen est basé sur un modèle de diffusion et peut générer des structures en fonction de groupes d'espaces cibles. Par exemple, lors de la conception de matériaux magnétiques multi-attributs, il propose des structures qui ont à la fois une densité magnétique élevée et une composition chimique à faible risque pour la chaîne d'approvisionnement. Parallèlement, le modèle est équipé de plusieurs modules d'adaptation réglables, qui peuvent être ajustés avec précision en fonction de contraintes telles que les propriétés chimiques, la symétrie et les caractéristiques des matériaux pour générer des matériaux répondant à des propriétés magnétiques, électroniques ou mécaniques spécifiques et les vérifier via DFT. On peut en déduire que la « personnalisation » de nouveaux matériaux en fonction d’un certain scénario pourrait devenir une réalité dans un avenir proche.
Outre les modèles de diffusion mentionnés ci-dessus, les principaux modèles génératifs actuels incluent également les réseaux antagonistes génératifs (GAN), les autoencodeurs variationnels (VAE), les modèles autorégressifs, etc. Leurs principes fondamentaux sont de générer de nouveaux échantillons en apprenant la distribution des données.
Dans cet article, HyperAI présentera la valeur des modèles génératifs dans la conception inverse de nouveaux matériaux et explorera les progrès spécifiques de cette technologie dans les matériaux de batterie, les alliages à haute entropie, les matériaux supraconducteurs, etc.
Similitudes entre le développement de nouveaux matériaux et la conception de protéines
Dans un problème typique de développement de matériaux, nous voulons trouver un nouveau matériau avec des propriétés spécifiques, ce qui revient en fait à trouver une structure cristalline appropriée qui correspond aux propriétés cibles.
Dans le passé, la manière dont nous développions de nouveaux matériaux reposait principalement sur des essais et des erreurs. Cette « conception prospective » se caractérise par une découverte allant de la structure aux propriétés. En prenant comme exemple la méthode de substitution la plus courante, le supraconducteur La-Ba-Cu-O est le plus ancien supraconducteur à base de cuivre, mais il ne supraconduit qu'à 35 K, ce qui est inférieur à la zone de température de l'azote liquide. À partir de la structure, les chercheurs ont remplacé l'élément La par l'élément Y et ont découvert que la température supraconductrice du supraconducteur Y-Ba-Cu-O est supérieure à la zone de température de l'azote liquide. Cependant, le cycle de recherche et de développement de cette méthode est très long et hautement accidentel.
Avec les progrès de la technologie informatique et de la théorie de la mécanique quantique, les méthodes de prédiction des matériaux basées sur la théorie de la fonctionnelle de la densité (DFT) ont progressivement mûri. Combinés à des algorithmes de recherche de structure et à des calculs à haut débit, les matériaux potentiels peuvent être efficacement criblés sur certaines bases de données selon certaines contraintes, puis envoyés au laboratoire pour synthèse et tests. Cependant, l’espace chimique des matériaux inconnus est extrêmement vaste et les combinaisons potentielles de différents éléments peuvent atteindre des millions, ce qui rend le coût de calcul du criblage à grande échelle très élevé.
La conception inversée pilotée par l’IA offre une nouvelle façon de penser. Il rompt avec la pensée inertielle du criblage de l'espace matériel et génère directement des structures matérielles qui répondent aux performances cibles, permettant ainsi une conception et une optimisation efficaces des matériaux.
En fait, la conception inversée pilotée par l’IA a réalisé des progrès révolutionnaires dans le domaine biomédical. En octobre 2024, le prix Nobel de chimie a concerné pour la première fois le domaine de l’IA, et la moitié du prix a été décernée à David Baker de l’Université de Washington en reconnaissance de ses contributions exceptionnelles à la conception des protéines. Dans plusieurs de ses études, nous pouvons observer des exemples de son utilisation inversée de l’apprentissage profond pour générer des séquences d’acides aminés afin de concevoir de nouvelles protéines fonctionnelles.

Il existe de nombreuses similitudes entre la recherche et le développement de nouveaux matériaux et la conception de protéines. Par exemple, les propriétés macroscopiques d’un matériau sont déterminées par sa structure microscopique, et il en va de même pour les protéines. Dans le domaine des protéines, la séquence d’acides aminés guide le repliement des protéines dans des structures secondaires, tertiaires et même quaternaires spécifiques, qui déterminent à leur tour leurs fonctions biologiques. De même, la science des matériaux s’appuie sur la sélection et l’agencement des atomes, des liaisons chimiques et des groupes fonctionnels pour construire des molécules ou des structures matérielles plus complexes, qui à leur tour déterminent leurs propriétés.
Cette similitude permet aux méthodes d’IA populaires dans la conception de protéines de fournir des informations sur la recherche en science des matériaux, telles que l’optimisation des propriétés des matériaux grâce à la conception inverse, l’exploration de nouvelles structures ou le développement de matériaux entièrement nouveaux.
Parallèlement, d’autres modèles génératifs, modèles visuels, modèles linguistiques et autres technologies avancées qui ont émergé dans le domaine biomédical, tels que l’apprentissage par renforcement, le mécanisme d’attention, le modèle de diffusion, le modèle pré-entraîné, la technologie multimodale, le mécanisme d’alignement de modèle, etc., ont également un large potentiel d’application en science des matériaux.
Il convient de mentionner que, dans la mesure où les nouveaux matériaux n’ont pas besoin de passer par le long cycle d’essais cliniques de la biomédecine et excluent l’influence de facteurs tels que la sécurité éthique, la possibilité d’une mise en œuvre réelle peut être plus grande.
En prenant Microsoft MatterGen comme exemple, nous explorons le nouveau paradigme de la conception inversée de matériaux par IA générative
Le modèle MatterGen de Microsoft est principalement basé sur une architecture de diffusion. Il détruit d'abord progressivement le type atomique, la position atomique et le réseau périodique en une structure aléatoire, puis entraîne un modèle pour terminer ce processus en sens inverse, permettant au modèle d'apprendre à restaurer progressivement la structure matérielle d'origine à partir du bruit aléatoire. Xie Tian, l'auteur correspondant de l'article, estime que cela est très similaire à l'idée centrale de la génération vidéo.
En prenant comme exemple le modèle vidéo Vincent Sora développé par OpenAI, les chercheurs ont utilisé la technologie du « réseau de compression vidéo » basée sur l'autoencodeur pour compresser les images ou vidéos d'entrée en données de dimension inférieure, et ont décomposé ces vidéos compressées en « patchs spatio-temporels », qui sont ensuite convertis en séquences de données unidimensionnelles pour le traitement de Transformer. Le transformateur termine ensuite la suppression du bruit de chaque patch spatio-temporel, puis le décodeur restaure les données du tenseur traitées dans une vidéo.

D'autre part, en se basant sur l'architecture de diffusion, les chercheurs ont laissé le modèle apprendre la structure des données de matériaux stables connus. Une fois le modèle formé, il peut échantillonner sans condition la distribution aléatoire et suivre le processus inverse pour permettre au modèle de générer de nouvelles structures matérielles qui répondent aux conditions en fonction de sa compréhension des lois matérielles. De plus, les chercheurs ont ajouté des conditions à chaque couche du réseau pour affiner le modèle de base. Ces conditions peuvent être des propriétés chimiques spécifiques, une symétrie ou toute propriété cible (magnétisme, densité, etc.). Après un réglage fin,Le modèle peut générer directement des structures matérielles selon des conditions spécifiées et vérifier leur stabilité grâce à des méthodes de calcul.
Comme indiqué ci-dessous, dans le cas de la génération de nouveaux matériaux pour le système chimique strontium-vanadium-oxygène, les structures matérielles générées par MatterGen semblent très raisonnables (fi), et les calculs ont vérifié que ces matériaux sont stables.

En plus de la vérification informatique, l'équipe a également collaboré avec l'Institut de technologie avancée de Shenzhen de l'Académie chinoise des sciences pour synthétiser avec succès un nouveau matériau TaGr à l'aide de MatterGen.2O6Le module de compression mesuré expérimentalement est de 169 GPa, ce qui présente une erreur relative inférieure à la valeur de conception de 200 GPa du 20%. Parallèlement, l’équipe espère également obtenir des commentaires de la part des scientifiques et continuer à itérer et à optimiser le modèle afin d’améliorer sa valeur d’application pratique.
Il convient de mentionner que, comme la plupart des problèmes de conception de matériaux impliquent la recherche de matériaux aux propriétés extrêmes, tels que les supraconducteurs à température ambiante et les conducteurs superioniques pour les batteries, les méthodes traditionnelles basées sur la recherche sont difficiles à mettre en œuvre, mais les modèles génératifs sont guidés par les propriétés cibles et peuvent offrir des opportunités de découverte de ces matériaux révolutionnaires.Microsoft utilise ce modèle pour explorer une variété de matériaux, couvrant la conception de batteries, la conception de cellules solaires et la capture du carbone.
Autres applications : Prenons l'exemple du développement d'alliages à haute entropie et de matériaux supraconducteurs
Nous savons tous que les nouveaux matériaux ne sont pas seulement la pierre angulaire du développement de domaines de haute technologie tels que l’aérospatiale, les nouvelles énergies, l’information électronique et la biomédecine, mais également l’épine dorsale du soutien aux nouvelles technologies, aux nouveaux équipements et aux nouveaux projets. Cependant, l’industrie actuelle des matériaux de mon pays est encore dominée par les matériaux traditionnels et l’offre de nouveaux matériaux, en particulier de nouveaux matériaux haut de gamme, est limitée. Dans le même temps, en raison de la pénurie de technologies clés, nous avons une certaine dépendance à l'égard des matériaux importés, et le problème des restrictions imposées par les lacunes de la population reste important.
Aujourd’hui, avec le développement de l’IA générative, la science des matériaux inaugure un nouveau changement de paradigme de recherche. Si nous pouvons entrer dans ce domaine émergent le plus tôt possible, cela pourrait offrir la possibilité de surmonter les lacunes et, espérons-le, de parvenir à « dépasser dans les courbes ». Ensuite, j’utiliserai des cas spécifiques d’IA générative dans le développement d’alliages à haute entropie, de matériaux supraconducteurs et d’autres applications comme exemple pour explorer comment cette technologie peut aider les nouveaux matériaux à réaliser un développement accéléré.
Alliage à haute entropie
Dans les applications d’ingénierie telles que les turbines à gaz, les réacteurs nucléaires et les systèmes de propulsion aérospatiale, il existe une forte demande d’alliages métalliques dotés d’excellentes propriétés mécaniques à haute température. Les alliages réfractaires à haute entropie (RHEA) peuvent maintenir une résistance élevée à des températures de 1 000 °C et plus en ajoutant différents éléments réfractaires à point de fusion élevé, présentant une résistance à haute température comparable à celle des alliages à haute température, ce qui a attiré une large attention de la part des chercheurs.
Cependant, comparés à d’autres alliages à haute température, les performances des RHEA dans certains aspects (tels que la ductilité à température ambiante) restent difficiles. Dans le passé, la conception des RHEA reposait principalement sur l’expérience et l’intuition des chercheurs, ce qui était très incertain. Dans le même temps, l’espace de composition possible des RHEA est vaste, contenant des milliards de composants candidats, ce qui limite considérablement notre découverte rapide d’alliages potentiels.
À cet égard, Wesley Reinhart, professeur adjoint au Département des sciences et de l'ingénierie des matériaux et à l'Institut des sciences informatiques et des données de l'Université d'État de Pennsylvanie, a publié un article intitulé « L'apprentissage profond génératif comme outil pour la conception inverse d'alliages réfractaires à haute entropie » dans le Journal of Materials Informatics, et est arrivé à une conclusion préliminaire selon laquelle les modèles génératifs sont une nouvelle méthode prometteuse pour la conception de matériaux, en particulier dans la conception d'alliages à haute entropie. Ce résultat a été classé comme le meilleur article de l’année par JMI.
Adresse du document :
https://www.oaepublish.com/articles/jmi.2021.05
Dans cet article, les chercheurs ont mentionné qu'au cours des 10 dernières années, les méthodes de calcul telles que la théorie de la fonctionnelle de la densité (DFT) ont fondamentalement mûri et accumulé une grande quantité de données, qui ont fourni une base pour l'application de l'apprentissage profond et favorisé le développement de « modèles avancés ». Malheureusement, l’immense espace de conception reste un défi majeur. La « conception inversée » de la modélisation générative apporte une solution à ce problème.
Les chercheurs ont donc utilisé des réseaux antagonistes génératifs conditionnels (CGAN) pour fournir au générateur des vecteurs conditionnels supplémentaires afin de contrôler sa sortie. En d'autres termes, le vecteur conditionnel peut fournir des informations liées à l'attribut cible (comme la composition de l'alliage ou l'indice de performance), établir une cartographie entre l'espace latent et l'indice souhaité, et le générateur génère des échantillons qui répondent aux conditions en apprenant la distribution de probabilité des données de performance de l'alliage en fonction de la composition de l'alliage. Il convient de mentionner que le modèle a été conçu avec succès pour les alliages d’aluminium et vérifié par des méthodes de calcul.

Il convient de mentionner que les chercheurs ont également mentionné qu'en plus de l'utilisation du CGAN, l'autoencodeur variationnel conditionnel (CVAE) peut également être utilisé pour la conception de nouveaux matériaux, mais en raison de l'injection de bruit inhérente au processus de formation et des exigences de mesure prédéfinies pour l'erreur de reconstruction, le VAE n'est pas aussi efficace que le GAN.
Matériaux supraconducteurs
Les matériaux supraconducteurs font référence à des conducteurs ayant une résistance nulle à une certaine température. Ils ont une large gamme d’applications, couvrant la transmission de puissance, les moteurs, les transports, l’aérospatiale, la microélectronique, les ordinateurs électroniques, les communications, la physique nucléaire, les nouvelles énergies, la bio-ingénierie, les soins médicaux et les équipements militaires. Depuis la découverte du phénomène de supraconductivité, ce domaine a donné lieu à de nombreux prix Nobel.
La découverte de nouveaux supraconducteurs à température critique (Tc) élevée a toujours été une tâche importante dans les domaines de la science des matériaux et de la physique de la matière condensée. L'Institut national des normes et de la technologie et d'autres chercheurs de Microsoft ont proposé un nouveau modèle de diffusion pour générer des supraconducteurs avec des structures et des compositions chimiques uniques. La recherche s'intitule « Conception inverse de supraconducteurs de nouvelle génération à l'aide de modèles génératifs profonds basés sur les données » et a été publiée dans The Journal of Physical Chemistry Letters.
Adresse du document :
https://pubs.acs.org/doi/10.1021/acs.jpclett.3c01260
Dans ce travail, les chercheurs ont mentionné que le principal défi dans l'application de modèles génératifs aux matériaux périodiques est de créer des représentations invariantes en translation et en rotation, un problème qui peut être résolu à l'aide d'un autoencodeur variationnel diffus à cristal (CDVAE).

Par conséquent, comme le montre la figure ci-dessus, les chercheurs ont formé le modèle CDVAE avec des données DFT de 1 058 matériaux supraconducteurs pour générer 3 000 nouveaux matériaux candidats supraconducteurs. Par la suite, le modèle d’apprentissage profond pré-entraîné ALIGNN a été utilisé pour prédire les propriétés supraconductrices de ces structures candidates, et 61 matériaux candidats ont été obtenus après criblage. Enfin, les chercheurs ont effectué des calculs DFT sur ces matériaux pour vérifier les prédictions et évaluer la stabilité dynamique et thermodynamique des nouveaux matériaux. Les structures de 15 matériaux supraconducteurs candidats potentiels sont présentées dans la figure ci-dessous. L’étude a révélé qu’une telle approche rend possible la conception inverse de la prochaine génération de matériaux.

Bien entendu, en plus des cas mentionnés ci-dessus, des modèles génératifs ont également été appliqués dans d’autres conceptions de matériaux. L'auteur a spécialement compilé quelques cas pour votre référence.
*Conception de batterie au lithium
Titre de l'article : Conception de batteries Li-ion grâce à l'optimisation microstructurale à l'aide de l'IA générative
Adresse du document :
https://www.cell.com/matter/fulltext/S2590-2385(24)00446-6
*Conception de matériaux nanocomposites
Titre de l'article : IA générative pour des fonctionnalités sur mesure dans les matériaux nanocomposites
Adresse du document :
https://easychair.org/publications/preprint/sDm2
*Conception matérielle 2D
Titre de la thèse : Découverte computationnelle de nouveaux matériaux 2D à l'aide de modèles génératifs d'apprentissage profond
Adresse du document :
https://pubs.acs.org/doi/abs/10.1021/acsami.1c01044
*Conception de matériaux composites techniques à base de ciment
Titre de l'article : IA générative pour la conception basée sur les performances des composites cimentaires techniques
Adresse du document :
https://www.sciencedirect.com/science/article/abs/pii/S1359836823004961
*Conception de matériaux mécaniques et biomimétiques
Titre de l'article : Améliorer les matériaux mécaniques et bioinspirés grâce à des approches d'IA génératives
Adresse du document :
https://www.sciencedirect.com/science/article/pii/S2949822824001722
Derniers mots
À l’heure actuelle, de nombreuses applications de l’IA générative dans la conception de matériaux sont encore au stade expérimental. Afin de mettre réellement en œuvre la technologie, en plus d’évaluer les propriétés des matériaux par des calculs, il est également nécessaire de s’appuyer sur une vérification expérimentale en situation réelle. À cet égard, la construction de laboratoires automatisés et la réalisation de découvertes en boucle fermée sont particulièrement importantes si nous voulons réduire l’écart entre le criblage informatique et la synthèse expérimentale de nouveaux matériaux et découvrir des matériaux rapidement avec un minimum de main-d’œuvre.
Prenons l’exemple du A-Lab, un laboratoire automatisé de l’Université de Californie à Berkeley. Il peut non seulement exécuter automatiquement des étapes expérimentales, mais également prendre des décisions de manière indépendante en fonction des données. En 17 jours de fonctionnement continu, il a synthétisé avec succès 41 des 58 matériaux cibles, avec un taux de réussite de 71%. Cela montre que l’utilisation de l’IA générative pour concevoir des matériaux et réaliser des synthèses et des vérifications efficaces via des laboratoires automatisés devient un moyen efficace de promouvoir le développement rapide de la science des matériaux.
Références :
1.https://nullthought.net/?p=5222&utm_source=chatgpt.com
2.https://academic.oup.com/nsr/article/9/8/nwac111/6605930?login=false
3.https://mp.weixin.qq.com/s/UX71cMgsEo49tLPiFu3D8A
4.https://mp.weixin.qq.com/s/e1DqTa1Tgyi4OWpgwrj48Q
5.https://www.youtube.com/watch?v=Smz1go6_Spo&t=896s
6.https://www.youtube.com/watch?v=yWXPV3bsC2c&t=7s
7.https://www.youtube.com/watch?v=Uv22eVcmmXA
