L'efficacité De La Recherche De Matériaux Supraconducteurs a Été Multipliée Par 5 ! L'Université De Floride Et D'autres Utilisent L'apprentissage Profond Pour Transformer La Découverte De Matériaux, Et Les Résultats Sont Publiés Dans Nature

Dans le film de science-fiction « Avatar », la montagne Hallelujah sur la planète Pandora, qui est enchevêtrée de vignes vertes et suspendue dans les nuages, a sans aucun doute laissé une profonde impression sur le public. Le secret de sa suspension réside dans le minéral supraconducteur à température ambiante « Unobtanium » caché dans les montagnes. Dans le film, les humains sont prêts à détruire la patrie des Na'vi afin de s'emparer de ce trésor qui n'existe pas sur Terre. Bien qu’il ne s’agisse que d’une histoire fictive, en réalité, le désir et la quête des physiciens pour les matériaux supraconducteurs ne sont pas moindres que l’obsession des êtres humains pour « l’Unobtanium » dans le film. Car en théorie, les matériaux supraconducteurs peuvent fournir une source d’énergie inépuisable.
Les recherches des chercheurs sur les matériaux supraconducteurs ont atteint un petit point culminant en 2023. À cette époque, l'équipe sud-coréenne a affirmé avoir découvert le matériau supraconducteur à température ambiante LK-99, qui a attiré une large attention dans le monde entier et a même été considéré par certains comme une autre avancée technologique majeure après ChatGPT. Bien que cette découverte se soit finalement avérée être un malentendu, elle a une fois de plus accru la popularité des matériaux supraconducteurs et a permis aux gens de voir l'énorme potentiel de ce domaine.
Avec l’essor de l’IA pour la science, les gens ont commencé à imaginer avec audace : la technologie de l’IA peut-elle être utilisée pour découvrir des matériaux supraconducteurs à température ambiante ? Théoriquement, cela est tout à fait réalisable et, même si des défis subsistent, certaines équipes de recherche ont déjà pris des mesures importantes à cet égard.Par exemple, des chercheurs de l'Université de Floride et de l'Université du Tennessee aux États-Unis ont réussi à prédire la fonction spectrale d'interaction électroacoustique d'Eliashberg α²F(ω) des métaux grâce au modèle d'apprentissage profond BETE-NET, et ont augmenté de 5 fois l'efficacité de la recherche de supraconducteurs à haute Tc.Cette réalisation fournit non seulement de nouvelles idées et méthodes pour la découverte de matériaux supraconducteurs, mais constitue également un exemple pour l’application de la technologie de l’IA dans le domaine de la science des matériaux.
Les résultats associés ont été publiés dans la revue académique npj Computational Materials sous le titre « Accélérer la découverte de supraconducteurs grâce à l'apprentissage profond tempéré de la fonction spectrale électron-phonon ».

Adresse du document :https://www.nature.com/articles/s41524-024-01475-4
Suivez le compte officiel et répondez « BETE-NET » pour obtenir le PDF complet
Adresse de téléchargement du jeu de données :
Le projet open source « awesome-ai4s » rassemble plus de 200 interprétations d'articles AI4S et fournit des ensembles de données et des outils massifs :
https://github.com/hyperai/awesome-ai4s
Le dilemme des matériaux supraconducteurs : le « dilemme » entre les ensembles de données d'entraînement et les techniques d'apprentissage automatique
L’efficacité des modèles d’IA pour les supraconducteurs dépend généralement de deux facteurs clés : l’ensemble de données d’entraînement et le choix de la technique d’apprentissage automatique.Ce n’est qu’en résolvant ces deux éléments clés que nous pourrons mieux promouvoir la recherche et le développement de matériaux supraconducteurs et jeter des bases solides pour l’innovation scientifique et technologique future. Cependant, les deux directions sont confrontées à de nombreuses difficultés.
Premièrement, les modèles capables d’estimer rapidement et précisément les propriétés supraconductrices des métaux nécessitent généralement des dizaines de milliers de points de données provenant de bases de données informatiques sur les matériaux. Cependant, contrairement à d’autres bases de données, il est extrêmement difficile de développer un ensemble de données α²F(ω) à grande échelle correspondant. Cela n’est pas seulement dû à son coût prohibitif, mais également à l’absence d’un ensemble standardisé de paramètres de théorie fonctionnelle de la densité (tels que les densités de points k et q, les valeurs de lissage, etc.) pour calculer avec précision α²F(ω). Compte tenu de ces obstacles, les scientifiques ont besoin d’un ensemble de techniques d’apprentissage automatique capables de traiter efficacement de petits ensembles de données pour surmonter les difficultés actuelles et promouvoir le développement de modèles d’estimation des propriétés supraconductrices.
Deuxièmement, dans le domaine de la recherche sur la supraconductivité, les chercheurs sont souvent confrontés à un défi majeur lorsqu’ils utilisent de tels modèles : les ensembles de données disponibles sont souvent hétérogènes et en nombre limité. Pendant longtemps, la recherche sur les matériaux supraconducteurs s'est principalement appuyée sur la célèbre base de données « SuperCon » contenant des valeurs expérimentales de Tc pour résoudre le problème des données limitées sur les propriétés supraconductrices. Cependant, la base de données présente de nombreux problèmes, notamment des entrées en double, des valeurs douteuses et des formules chimiques peu claires. L’absence de cet ensemble de données vaste et complet limite non seulement considérablement le développement de nouveaux matériaux supraconducteurs, mais entrave également sérieusement le potentiel révolutionnaire des matériaux supraconducteurs dans la transmission d’énergie, la lévitation magnétique dans le domaine des transports et les puissants aimants supraconducteurs dans l’imagerie médicale.
Bien qu'un certain nombre de bases de données de structures de matériaux et de α²F(ω) calculés aient émergé, telles que la base de données Superhydra proposée par l'Institut de physique théorique et computationnelle de l'Université de technologie de Graz, qui ne contient que des hydrures à haute pression, la base de données lancée par l'Institut de physique de Halle en Allemagne qui se concentre sur les supraconducteurs Heusler, le modèle formé par des chercheurs du Département de physique de l'Université de Coimbra au Portugal sur la base de 7 000 calculs électron-phonon, et la base de données développée par le National Institute of Standards and Technology aux États-Unis qui contient 626 matériaux dynamiquement stables et leurs α²F(ω) associés, ces bases de données ont encore de faibles performances pour prédire α²F(ω).
Afin de mieux résoudre ces problèmes,Dans cette étude, des chercheurs de l'Université de Floride et de l'Université du Tennessee ont réussi à aborder ces deux éléments clés en créant un ensemble complet de données de fonctions spectrales d'Eliashberg et en développant un modèle robuste utilisant des techniques modernes d'apprentissage en profondeur, ouvrant de nouvelles voies pour la recherche et le développement de matériaux supraconducteurs.Cette réalisation fournit non seulement de nouvelles méthodes et de nouveaux outils pour la recherche sur les matériaux supraconducteurs, mais pose également une base solide pour l’innovation et l’application scientifiques et technologiques futures.
BETE-NET : élargir considérablement les limites de l'exploration informatique avec des données limitées
Lors du calcul du couplage électron-phonon, vous devez vous assurer que le maillage à points k utilisé pour calculer les fonctions d'onde de Kohn-Sham correspond au maillage à points q utilisé pour calculer les phonons. Pour résoudre le problème de l'ensemble de données, cette étude a d'abord proposé un algorithme de sélection standardisée de maillages k et q, qui peut générer des maillages basés sur les densités de points k et q fournies par l'utilisateur, au lieu d'utiliser un maillage fixe pour gérer des matériaux avec différents volumes de cellules unitaires. Grâce à cette approche, les chercheurs ont non seulement amélioré l’uniformité et la qualité des données, mais ont également assuré la large applicabilité de l’ensemble de données.Le résultat est une base de données complète de calculs électron-phonon de haute qualité pour 818 matériaux dynamiquement stables.Ensuite, les chercheurs ont divisé les 818 matériaux dynamiquement stables en ensembles d’entraînement et de test dans le rapport 80%-20%.
Adresse de téléchargement du jeu de données :
https://go.hyper.ai/GjZDo
Après avoir évalué la qualité de l’ensemble de données, les chercheurs ont conçu BETE-NET pour résoudre le problème d’apprentissage en profondeur de la taille limitée de la base de données.Comme le montre la figure ci-dessous, le modèle BETE-NET convertit la structure cristalline en un graphique et combine le numéro atomique, la masse atomique, la distance interatomique et les informations PhDOS de la projection du site via une série d'opérations de convolution et de blocs fermés, et génère finalement une prédiction de α²F(ω) via une opération de pooling. En introduisant les informations PhDOS, les performances de prédiction du modèle sont considérablement améliorées. Cette conception exploite non seulement pleinement les informations de la structure cristalline, mais combine également les caractéristiques de vibration du matériau, rendant le modèle plus précis et fiable dans la prédiction de l'α²F(ω) des matériaux supraconducteurs. Au final, l’étude a formé 3 variantes :
* Variante CSO (Crystal Structure Only) : le réseau de base du modèle, utilisant uniquement les informations de structure cristalline pour les prédictions.
* Variante CPD (PhDOS grossier) : le modèle introduit des informations de densité d'états de phonons projetées sur site (PhDOS), améliorant encore les performances prédictives du modèle.
* Variante FPD (Fine PhDOS) : le PhDOS est calculé à l'aide d'un maillage q plus fin, améliorant encore la capacité du modèle à capturer les propriétés vibratoires du matériau.

Avec des données limitées, les modèles ont tendance à s'adapter rapidement. Bien que l’apprentissage automatique traditionnel considère que le surajustement est préjudiciable à la capacité de généralisation du modèle, de nombreux modèles d’apprentissage profond peuvent toujours conserver une bonne erreur de généralisation lorsqu’ils sont entraînés à une perte proche de zéro. Ce phénomène est appelé « double descente » et peut être considéré comme une forme de surapprentissage contrôlé. Comme le montre la figure ci-dessous, le phénomène de double déclin se compose de trois étapes : le régime classique, le régime critique et le régime moderne, et le paysage des pertes de chaque étape est présenté dans l'illustration. En traçant ces paysages de pertes, les chercheurs proposent une manière plausible d’interpréter intuitivement le biais et la variance des réseaux neuronaux, fournissant une explication qualitative du phénomène de double descente.

Cette étude a été validée ultérieurement lors du criblage de matériaux à haute Tc.Dans un premier temps, l’étude a défini tous les matériaux avec Tc^DFT≥5K comme des matériaux à haute T, et finalement 33 matériaux répondaient à ce critère. Ensuite, l’étude a tracé les courbes de précision-rappel pour chaque modèle. Les résultats montrent que la précision moyenne (AP) obtenue par les modèles CPD et FPD est presque 5 fois supérieure à celle d’un classificateur aléatoire. Cela montre que ces modèles fonctionnent bien dans l'identification des matériaux à haute Tc, surpassant considérablement les classificateurs aléatoires, vérifiant ainsi l'efficacité et la fiabilité des modèles dans les applications pratiques.

En résumé, le modèle BETE-NET est un parfait exemple de la fusion parfaite des connaissances spécifiques au domaine et de la technologie avancée d’apprentissage en profondeur. Il peut prédire efficacement la fonction spectrale d'interaction électroacoustique d'Eliashberg α²F(ω) des métaux avec des données limitées. Non seulement cela élargit considérablement les limites de l’exploration informatique, mais cela devrait également avoir un impact social transformateur en aidant à la découverte de nouveaux supraconducteurs.
Réseaux neuronaux équivariants : contribuer à la naissance d'AlphaFold dans l'industrie des matériaux
Il est intéressant de noter que peu de temps après la publication de cette étude, le 17 janvier,Le PDG de Microsoft, Satya Nadella, a personnellement annoncé que son modèle MatterGen avait été publié dans le magazine Nature.Ce modèle est capable d’aller au-delà des matériaux actuellement connus et d’utiliser l’IA pour découvrir de nouveaux matériaux pour des besoins spécifiques. Cela marque un nouveau paradigme dans le domaine de la conception de matériaux : un passage du criblage traditionnel de bases de données à la génération directe de nouveaux matériaux en fonction des demandes. Certains internautes se sont exclamés : « L’AlphaFold du monde des matériaux est là. »
Il convient de noter que la clé du modèle MatterGen réside dans son architecture de modèle de diffusion unique. Dans ce processus de diffusion, le modèle MatterGen utilise un réseau fractionnaire équivariant, qui est également le modèle sélectionné dans cette étude lors de l'apprentissage de α²F(ω). Il est principalement responsable de la récupération de la structure cristalline d'origine à partir du processus de diffusion, c'est-à-dire du processus de débruitage.
Le réseau neuronal équivariant ajoute l’exigence de contrainte équivariante sur la base du réseau neuronal traditionnel. Chaque opération dans le réseau doit être équivariante, donc l'ensemble du réseau est une cartographie équivariante. En fait, les réseaux neuronaux équivariants sont devenus le courant dominant de la recherche en IA pour la science dans le domaine des matériaux.
En septembre dernier, des chercheurs de l’Université de Tohoku au Japon et du Massachusetts Institute of Technology ont lancé un nouvel outil d’intelligence artificielle appelé GNNOpt.En intégrant des réseaux neuronaux équivariants, GNNOpt a obtenu des prédictions de haute qualité en utilisant un petit ensemble de données de 944 matériaux, identifiant avec succès 246 matériaux avec des rendements de conversion d'énergie solaire dépassant 32% et 296 matériaux quantiques avec des poids quantiques élevés, accélérant considérablement la découverte de l'énergie et des matériaux quantiques.
En août dernier, le groupe de recherche dirigé par Xu Yong et Duan Wenhui de l'Université Tsinghua a proposé le cadre DFT du réseau neuronal.Cette étude utilise l'intégration des informations sur la structure matérielle comme conditions d'entrée pour le réseau neuronal équivariant, puis génère la matrice hamiltonienne, unifiant ainsi la minimisation de la fonction de perte dans le réseau neuronal et l'optimisation fonctionnelle de l'énergie dans la théorie fonctionnelle de la densité. Comparé aux méthodes d’apprentissage supervisé traditionnelles, ce cadre présente une précision et une efficacité supérieures et ouvre de nouvelles voies pour le développement de méthodes DFT d’apprentissage en profondeur. Auparavant, l'équipe de recherche avait également proposé la méthode xDeepH (DeepH étendu), qui utilise un cadre de réseau neuronal équivariant profond pour représenter l'hamiltonien DFT des matériaux magnétiques, réalisant ainsi des calculs de structure électronique efficaces.
Aujourd’hui, les réseaux neuronaux équivariants conduisent le domaine des matériaux supraconducteurs vers un nouveau paradigme de recherche. La recherche et l’application des matériaux supraconducteurs ne se limitent plus aux laboratoires, mais sont progressivement intégrées à la vie réelle, et leur potentiel de marché est également continuellement libéré. On prévoit que le marché mondial des matériaux supraconducteurs continuera de croître et devrait atteindre 19,2 milliards d'euros d'ici 2027. Avec l'intégration profonde des technologies d'IA telles que les réseaux neuronaux équivariants et les matériaux supraconducteurs, les humains touchent au « point de transition » de la technologie, inaugurant une nouvelle ère pleine de possibilités infinies.
