HyperAIHyperAI

Command Palette

Search for a command to run...

Des Scientifiques Ont Créé Indépendamment De Nouveaux Matériaux En Procédant À Une Rétro-ingénierie De Matériaux Contenant Du Gallium À l'aide d'un Cadre d'optimisation bayésienne. Les Résultats De Cette Optimisation Sont Uniques Et novateurs.

Featured Image

Dans l'industrie moderne des semi-conducteurs, les limites de la performance des matériaux sont constamment repoussées. Des dispositifs photovoltaïques à haut rendement aux diodes électroluminescentes (DEL) à haute luminosité, en passant par les communications à haute fréquence et les systèmes d'information quantique, presque toutes les technologies clés reposent sur une capacité fondamentale :Contrôle précis de la structure électronique des matériaux, et notamment conception précise de la bande interdite.Cependant, cet objectif s'est longtemps avéré difficile à atteindre dans le système traditionnel des sciences des matériaux.

En effet, les propriétés électroniques d'un matériau ne sont pas déterminées par un seul élément, mais sont influencées par des liaisons chimiques complexes, la structure cristalline, l'hybridation des orbitales électroniques et les effets synergiques de plusieurs éléments. Parmi les nombreux systèmes de matériaux, les semi-conducteurs à base de gallium occupent une place unique.L'excellente diversité chimique et les caractéristiques de multivalence du gallium lui permettent de présenter une gamme de propriétés électroniques ajustables, allant d'une large bande interdite à une bande interdite étroite.

Les composés contenant du gallium sont devenus essentiels pour des technologies optoélectroniques et de conversion d'énergie clés, telles que les cellules solaires à haut rendement, les LED haute luminosité et les dispositifs de communication à haute fréquence. Ils apparaissent également comme des matériaux candidats potentiels pour les systèmes électroniques flexibles, biocompatibles et implantables. Cependant, malgré des décennies de recherche, la découverte de nouveaux matériaux à base de gallium aux propriétés électroniques spécifiques repose encore largement sur une approche empirique.Cette limitation est principalement due au vaste espace de conception des composants et au coût de calcul élevé des calculs basés sur les principes fondamentaux.

Dans ce contexte, une équipe de recherche dirigée par l'université Flinders en collaboration avec l'université Khalifa aux Émirats arabes unis a proposé un cadre d'optimisation bayésienne (BO) guidé par l'apprentissage automatique qui permet la conception inverse de composants à base de gallium avec des propriétés électroniques prédéfinies tout en maintenant la rationalité chimique.

Grâce à ce cadre unifié,Le système peut générer de manière autonome de nouveaux matériaux contenant du gallium chimiquement efficaces et atteindre une bande interdite ajustable de 0,5 à 3,5 eV.Cette gamme d'énergie est cruciale pour les applications dans les domaines de l'énergie solaire, de la photonique et de l'électronique de puissance. Le processus d'optimisation bayésienne permet d'orienter la recherche de manière adaptative vers la région offrant la plus grande amélioration. Les résultats de l'analyse optimisée montrent que le matériau généré présente une unicité et une nouveauté par rapport aux données d'entraînement, et que l'efficacité de SMACT est significativement améliorée dans la gamme de bande interdite de 1,5 à 2,5 eV.

Les résultats de recherche associés, intitulés « Découverte guidée par l'optimisation bayésienne de semi-conducteurs contenant du gallium avec des bandes interdites ciblées », ont été publiés dans ACS Publications.

Points saillants de la recherche :

Ce nouveau cadre peut accélérer la conception inverse de matériaux dans des conditions de contraintes chimiques réalistes, offrant une alternative aux méthodes de criblage traditionnelles basées sur la DFT (théorie fonctionnelle de la densité).

* Ce nouveau cadre couvre non seulement efficacement les régions chimiquement plausibles, mais maintient également un haut degré de nouveauté et de diversité des composants par rapport aux bases de données existantes.

* Ces recherches lèvent les limites des prédictions statiques traditionnelles des propriétés, propulsant la découverte des semi-conducteurs vers un paradigme de recherche générative axé sur les données.

image

Adresse du document :
https://pubs.acs.org/doi/10.1021/acsmaterialslett.5c01482

Jeux de données : Construction d’un espace d’apprentissage chimique à partir de bases de données de matériaux réels

Cette étude a utilisé les bases de données NOMAD et Materials Project pour entraîner le modèle.Les données comprennent la composition chimique du matériau et sa valeur de bande interdite expérimentale correspondante.Par exemple, Ga₄P₄, GaAs, GaN, Ga₂O₃, etc. L'ensemble de données initial contient 2 530 compositions de matériaux et leurs enregistrements de bande interdite.

Afin de garantir la qualité des données, les échantillons présentant des valeurs manquantes dans les colonnes « composition » ou « band_gap » ont été supprimés. Les données de bande interdite non physiques ou négatives ont également été éliminées, de même que les enregistrements dupliqués, ce qui a permis de conserver 1 578 composants valides pour la modélisation. Par ailleurs, les formules chimiques ont été normalisées à l’aide du package pymatgen afin de fusionner les termes chimiquement équivalents. L’unité de bande interdite a été uniformément convertie de joules en électronvolts (eV). Dans l’ensemble de données prétraité, la bande interdite variait de 0,0 à 5,92 eV, avec une moyenne d’environ 1,8 eV et un écart type de 1,6 eV.

L'étude a ensuite examiné la composition des matériaux, ne retenant que les composés contenant des éléments appartenant à un ensemble prédéfini de numéros atomiques afin de garantir que la recherche porte sur les systèmes de matériaux à base de gallium. Plusieurs caractéristiques supplémentaires ont également été développées, notamment :

* Nombre d'éléments dans chaque formule chimique

* Longueur de la chaîne de la formule chimique

* Un indicateur binaire de la présence ou de l'absence de gallium

L'ensemble de données a ensuite été divisé aléatoirement en ensembles d'entraînement et de test selon un ratio de 8:2, la division étant effectuée au niveau des composés afin d'éviter la présence simultanée de composés chimiquement similaires dans différents ensembles. Une validation croisée à cinq plis a également été utilisée pour évaluer la robustesse du modèle sous différentes conditions de partitionnement des données.

Cadre : Co-conception de l’apprentissage automatique et de l’optimisation bayésienne

Cette étude propose un cadre d'optimisation bayésienne (BO) à contraintes chimiques.Comme illustré dans la figure ci-dessous, la méthode utilise d'abord un modèle de régression par gradient boosting entraîné sur un ensemble de données de matériaux composites à base de gallium pour prédire la bande interdite du matériau ; ensuite, une optimisation bayésienne est utilisée pour explorer itérativement un espace de composition contraint ; enfin, les matériaux candidats générés sont sélectionnés en fonction de leur validité chimique, de leur nouveauté et de leur unicité à l'aide des outils SMACT et pymatgen, identifiant ainsi les matériaux composites à base de gallium les plus performants qui n'ont pas été explorés auparavant.

image
Flux de travail guidé par l'apprentissage automatique pour la découverte de matériaux composites à base de gallium

Couche du modèle de prédiction

Cette étude a évalué de manière systématique huit algorithmes de régression d'apprentissage automatique, incluant les modèles linéaires, la régression à vecteurs de support, les forêts aléatoires, le gradient boosting et la méthode des k plus proches voisins (KNN). Les résultats montrent que le modèle non linéaire surpasse significativement le modèle linéaire, ce qui indique une forte relation non linéaire entre la composition du matériau et la bande interdite.Le modèle KNN a obtenu les meilleurs résultats, avec un R² de 0,812, et a également surpassé les autres modèles en termes de mesures d'erreur.

Parmi tous les modèles candidats, le modèle KNN a finalement été sélectionné comme modèle de substitution dans l'optimisation bayésienne.La raison en est qu'il possède d'excellentes capacités d'interpolation locale et maintient des performances stables dans différentes conditions de partitionnement aléatoire.Contrairement aux modèles d'ensemble basés sur les arbres, KNN peut préserver les relations de voisinage dans l'espace des caractéristiques des composants, ce qui est crucial pour identifier les similarités entre des matériaux ayant des proportions d'éléments similaires.

Dans les scénarios d'optimisation bayésienne, cette « capacité de préservation locale » est particulièrement importante car les recherches d'optimisation se concentrent souvent sur les régions potentielles proches de candidats de haute qualité connus. Par conséquent, les caractéristiques non paramétriques et adaptatives locales de l'algorithme KNN peuvent fournir à l'optimiseur un guidage de recherche plus fluide et plus fiable, tout en maintenant une efficacité de calcul élevée dans les espaces de matériaux peu échantillonnés.

Module d'optimisation bayésienne

Ce flux de travail BO utilise le modèle de substitution KNN pour guider la recherche de composants contenant du gallium dans la bande interdite cible.En utilisant la fonction d'acquisition « Amélioration attendue », un équilibre est trouvé entre « exploration » et « utilisation », générant ainsi des stœchiométries candidates dans un espace de composition centré sur le gallium.

Le système impose plusieurs contraintes, notamment : chaque composant doit contenir un maximum de 4 éléments et doit respecter une teneur minimale en gallium afin de garantir que les matériaux candidats restent pertinents pour les sujets de recherche basés sur le gallium.

Couche filtrante à contrainte chimique

Tous les matériaux candidats générés doivent être vérifiés à l'aide de l'outil SMACT, y compris les contraintes telles que l'équilibre des charges, un état d'oxydation raisonnable et la cohérence de l'électronégativité, afin de garantir que les matériaux générés sont non seulement valides dans l'espace mathématique, mais aussi chimiquement réalisables.

De plus, le cadre intègre des méthodes d'intelligence artificielle explicable (XAI), utilisant SHAP pour analyser la logique de décision du modèle, transformant ainsi la prédiction des matériaux d'une « boîte noire » en un « système explicable ».

Accélération de la conception inverse des matériaux sous des contraintes chimiques réalistes

Les chercheurs ont conçu une série d'expériences pour évaluer et analyser les performances, les caractéristiques structurelles, l'interprétabilité et la validité chimique du modèle :

Évaluation des performances du modèle

En termes d'évaluation des performances du modèle, le modèle KNN a montré une stabilité lors de la validation croisée, avec un R² d'environ 0,60 ± 0,07 et un RMSE d'environ 1,02 eV, indiquant que le modèle possède une bonne capacité de généralisation dans des espaces chimiques clairsemés.

Comme le montre l'analyse d'importance des caractéristiques ci-dessous, le point de fusion, la gamme d'électronégativité et l'écart d'électronégativité sont des facteurs clés influençant la prédiction de la bande interdite. Ces facteurs sont étroitement liés à la force des liaisons et au comportement de transfert de charge dans les matériaux. Lorsque les différences d'électronégativité augmentent, la bande interdite tend à diminuer, tandis que l'augmentation du point de fusion et de l'énergie de cohésion correspond à des bandes interdites plus larges — un comportement tout à fait conforme à la physique classique des semi-conducteurs.

image
Les caractéristiques les plus importantes du modèle KNN final. Le graphique à barres représente la contribution relative de chaque caractéristique au gain de division du modèle ; les valeurs les plus élevées indiquent un impact plus significatif.

La capacité d'apprendre de véritables règles chimiques à partir de données

Au cours de la phase de génération, l'optimisation bayésienne a proposé 1 025 composants candidats contenant du gallium, dont seulement 38 ont passé le criblage SMACT, indiquant que les contraintes de faisabilité chimique étaient extrêmement strictes.Ces matériaux efficaces se concentrent principalement dans la gamme 2,0–2,5 eV, ce qui signifie qu'il est plus aisé de former des semi-conducteurs à bande interdite moyenne présentant des caractéristiques de liaison à la fois ioniques et covalentes dans cette région. Ces résultats sont en parfait accord avec des systèmes connus, tels que Ga₂O₃ (≈4,8 eV) et Ga₂S₃ (≈2,5 eV).

Le processus de recherche BO montre également une tendance à se regrouper autour de familles chimiques connues contenant du gallium (telles que Ga–O, Ga–N, Ga–As/Sb), et propose de nouvelles stœchiométries intermédiaires dans ces régions, telles que : Ga₀.₅₁As₀.₁₆N₀.₂₄Sb₀.₁₀, Ga₀.₁₇₁Sb₀.₁₇₅O₀.₃₆₇F₀.₂₈₆.

Pour les matériaux à large bande interdite (> 3,0 eV), l'algorithme privilégie les composés riches en oxygène car les liaisons Ga–O fortes contribuent à élargir la bande interdite ; tandis que les matériaux à bande interdite plus faible (environ 1,5–2,0 eV) sont généralement obtenus en remplaçant l'oxygène par du soufre, du sélénium ou du phosphore, ce qui introduit des interactions π–π plus fortes. Ces tendances sont très cohérentes avec les observations expérimentales existantes, ce qui indique que le modèle a pu « apprendre implicitement » les règles chimiques réelles à partir des données.

La capacité à saisir les « relations structure-propriété » réelles

Pour confirmer que la composition contenant du gallium générée correspond à un matériau « physiquement réalisable », l'équipe de recherche a utilisé le modèle Chemelon-dng développé par Park et al. pour prédire son prototype cristallin, comme le montre la figure ci-dessous :

image
Structures cristallines représentatives des composés composites contenant du gallium (Ga) générés

Les composants candidats validés par SMACT présentaient des environnements de coordination chimiquement plausibles, dominés par des centres de gallium tétraédriques et octaédriques, ce qui est en parfaite cohérence avec des prototypes cristallins connus tels que Ga₂O₃, GaN et GaSe. Le modèle de substitution a reproduit avec succès les relations hiérarchiques de structure électronique empiriquement cohérentes : oxydes : 3,5–4,8 eV, chalcogénures : 1,8–2,6 eV et composés azotés du groupe A : environ 1,2–2,0 eV, soit : bande interdite des oxydes > bande interdite des chalcogénures > bande interdite des composés azotés du groupe A.

Ce résultat indique que,Ce flux de travail d'optimisation bayésienne est désormais capable de capturer efficacement les « relations structure-propriété » du monde réel.

Il convient de noter qu'aucun des 38 composants valides qui ont été vérifiés n'était un doublon de matériaux connus existants, ce qui prouve encore davantage que les résultats générés présentent à la fois une « nouveauté » et une « cohérence chimique ».

Vérification DFT

Les chercheurs ont ensuite procédé à une validation par DFT. Le tableau ci-dessous résume les résultats de la comparaison entre la « bande interdite prédite par le modèle » et la « bande interdite calculée par DFT » parmi les 10 composants ayant passé la validation SMACT, ainsi que les types de bandes interdites correspondants.

image
Comparaison des bandes interdites prédites par le modèle et des bandes interdites calculées par DFT pour dix composants validés par SMACT.

Globalement, l'erreur absolue moyenne (MAE) était de 0,890 eV, l'erreur quadratique moyenne (RMSE) de 1,158 eV et l'erreur absolue médiane de 0,784 eV. Malgré certains biais, cette méthode présente un intérêt pratique considérable lors de la phase de criblage précoce de la découverte de nouveaux matériaux. Plus important encore, aucun des matériaux validés n'était répertorié dans les bases de données connues, ce qui témoigne de leur grande nouveauté.

Conclusion

Globalement, cette étude démontre un nouveau paradigme de conception de matériaux pour les semi-conducteurs contenant du gallium : un chemin de génération automatisé des « données » aux « nouveaux matériaux » grâce à l’effet synergique de la modélisation d’apprentissage automatique, de la recherche d’optimisation bayésienne et du criblage des contraintes chimiques.

D'un point de vue industriel, cette approche présente un intérêt certain pour la conception de matériaux photovoltaïques, le développement de dispositifs électroluminescents et la recherche sur les semi-conducteurs à large bande interdite. Dans un contexte de développement rapide des dispositifs électroniques de puissance et optoélectroniques de nouvelle génération, la demande en matériaux à bande interdite contrôlable croît rapidement, et les méthodes de conception de matériaux pilotées par l'IA devraient devenir un outil essentiel pour accélérer ce processus.

De plus, l'importance de ce cadre ne se limite pas au système du gallium ; sa méthodologie peut également être étendue à l'indium, à l'étain, et même aux systèmes semi-conducteurs sans plomb, offrant ainsi une voie générale pour la conception rationnelle de composés multicomposants complexes. Ceci marque une nouvelle étape en science des matériaux, passant d'une approche empirique par essais et erreurs à une approche algorithmique, l'intelligence artificielle devenant un lien essentiel entre les règles chimiques et la découverte de nouveaux matériaux.

Références :

https://techxplore.com/news/2026-05-ai-discovery-gen-chips-electronic.html
https://pubs.acs.org/doi/10.1021/acsmaterialslett.5c01482