HyperAI

Die Effizienz Der Suche Nach Supraleitendem Material Wurde Um Das Fünffache Erhöht! Die University of Florida Und Andere Nutzen Deep Learning, Um Die Materialforschung Zu Revolutionieren. Die Ergebnisse Wurden in Nature Veröffentlicht.

特色图像

Im Science-Fiction-Film „Avatar“ hinterließ der von grünen Ranken umrankte und in den Wolken schwebende Halleluja-Berg auf dem Planeten Pandora zweifellos einen tiefen Eindruck beim Publikum. Das Geheimnis seiner Aufhängung liegt im bei Raumtemperatur supraleitenden Mineral „Unobtanium“, das in den Bergen verborgen ist. Im Film sind die Menschen bereit, die Heimat der Na'vi zu zerstören, um diesen Schatz zu erbeuten, den es auf der Erde nicht gibt. Obwohl es sich hierbei nur um eine fiktive Geschichte handelt, ist der Wunsch und das Streben der Physiker nach supraleitenden Materialien in Wirklichkeit nicht geringer als die Obsession der Menschen mit „Unobtanium“ im Film. Denn supraleitende Materialien können theoretisch eine unerschöpfliche Energiequelle darstellen.

Die Forschung der Forscher zu supraleitenden Materialien erreichte im Jahr 2023 einen kleinen Höhepunkt. Damals behauptete das südkoreanische Team, das bei Raumtemperatur supraleitende Material LK-99 entdeckt zu haben, das weltweit große Aufmerksamkeit erregte und von manchen sogar als ein weiterer großer technologischer Durchbruch nach ChatGPT angesehen wurde. Obwohl sich diese Entdeckung letztlich als Missverständnis herausstellte, steigerte sie die Popularität supraleitender Materialien erneut und machte den Menschen das enorme Potenzial dieses Bereichs bewusst.

Mit dem Aufkommen der KI in der Wissenschaft begannen die Menschen, sich kühne Vorstellungen zu machen: Kann KI-Technologie zur Entdeckung supraleitender Materialien bei Raumtemperatur eingesetzt werden? Theoretisch ist dies durchaus machbar und obwohl noch Herausforderungen bestehen, haben einige Forschungsteams in dieser Hinsicht bereits wichtige Schritte unternommen.So gelang es Forschern der University of Florida und der University of Tennessee in den USA, die Eliashberg-Spektralfunktion α²F(ω) der elektroakustischen Wechselwirkung von Metallen mithilfe des Deep-Learning-Modells BETE-NET vorherzusagen und die Effizienz der Suche nach Hochtemperatur-Supraleitern um das Fünffache zu steigern.Diese Errungenschaft liefert nicht nur neue Ideen und Methoden für die Entdeckung supraleitender Materialien, sondern ist auch ein Beispiel für die Anwendung von KI-Technologie im Bereich der Materialwissenschaften.

Die entsprechenden Ergebnisse wurden in der Fachzeitschrift npj Computational Materials unter dem Titel „Accelerating superconductor discovery through tempered deep learning of the electron-phonon spectral function“ veröffentlicht.

Papieradresse:https://www.nature.com/articles/s41524-024-01475-4

Folgen Sie dem offiziellen Konto und antworten Sie mit „BETE-NET“, um das vollständige PDF zu erhalten

Adresse zum Herunterladen des Datensatzes:

https://go.hyper.ai/GjZDo

Das Open-Source-Projekt „awesome-ai4s“ vereint mehr als 200 AI4S-Papierinterpretationen und stellt umfangreiche Datensätze und Tools bereit:

https://github.com/hyperai/awesome-ai4s

Das Dilemma supraleitender Materialien: das „Dilemma“ zwischen Trainingsdatensätzen und Techniken des maschinellen Lernens

Die Wirksamkeit von KI-Modellen für Supraleiter hängt im Allgemeinen von zwei Schlüsselfaktoren ab: dem Trainingsdatensatz und der Wahl der maschinellen Lerntechnik.Nur durch die Lösung dieser beiden Schlüsselfaktoren können wir die Forschung und Entwicklung supraleitender Materialien besser vorantreiben und eine solide Grundlage für zukünftige wissenschaftliche und technologische Innovationen legen. Allerdings sind beide Richtungen mit zahlreichen Schwierigkeiten konfrontiert.

Erstens benötigen Modelle, die die supraleitenden Eigenschaften von Metallen schnell und genau schätzen können, normalerweise Zehntausende von Datenpunkten aus Materialinformatik-Datenbanken. Im Gegensatz zu anderen Datenbanken ist es jedoch äußerst schwierig, einen entsprechenden α²F(ω)-Datensatz im großen Maßstab zu entwickeln. Dies liegt nicht nur an den unerschwinglichen Kosten, sondern auch am Fehlen eines standardisierten Satzes von Dichtefunktionaltheorie-Parametern (wie etwa k-Punkt- und q-Punkt-Dichten, Glättungswerte usw.), um α²F(ω) genau zu berechnen. Angesichts dieser Hindernisse benötigen Wissenschaftler eine Reihe von Techniken des maschinellen Lernens, die kleine Datensätze effektiv verarbeiten können, um die aktuellen Schwierigkeiten zu überwinden und die Entwicklung von Modellen zur Schätzung der Eigenschaften von Supraleitern voranzutreiben.

Zweitens stehen Forscher im Bereich der Supraleitungsforschung bei der Verwendung solcher Modelle oft vor einer großen Herausforderung: Die verfügbaren Datensätze sind oft heterogen und zahlenmäßig begrenzt. Um das Problem der begrenzten Datenlage zu supraleitenden Eigenschaften zu lösen, stützte man sich bei der Forschung zu supraleitenden Materialien lange Zeit vor allem auf die bekannte „SuperCon“-Datenbank mit experimentellen Tc-Werten. Allerdings weist die Datenbank viele Probleme auf, beispielsweise enthält sie viele doppelte Einträge, fragwürdige Werte und unklare chemische Formeln. Das Fehlen dieses großen, umfassenden Datensatzes schränkt nicht nur die Entwicklung neuer supraleitender Materialien erheblich ein, sondern behindert auch ernsthaft das revolutionäre Potenzial supraleitender Materialien bei der Energieübertragung, der Magnetschwebetechnik im Transportbereich und leistungsstarker supraleitender Magnete in der medizinischen Bildgebung.

Obwohl es inzwischen eine Reihe von Datenbanken mit Materialstrukturen und berechneten α²F(ω)-Werten gibt, wie etwa die vom Institut für Theoretische und Computergestützte Physik der Technischen Universität Graz vorgeschlagene Datenbank Superhydra, die nur Hochdruckhydride enthält, die vom Physikinstitut Halle in Deutschland gestartete Datenbank, die sich auf Heusler-Supraleiter konzentriert, das von Forschern der Fakultät für Physik der Universität Coimbra in Portugal trainierte Modell, das auf 7.000 Elektron-Phonon-Berechnungen basiert, und die vom National Institute of Standards and Technology in den USA entwickelte Datenbank, die 626 dynamisch stabile Materialien und die zugehörigen α²F(ω)-Werte enthält, liefern diese Datenbanken bei der Vorhersage von α²F(ω) immer noch schlechte Ergebnisse.

Um diese Probleme besser zu lösen,In dieser Studie haben sich Forscher der University of Florida und der University of Tennessee erfolgreich mit diesen beiden Schlüsselelementen befasst, indem sie einen umfassenden Datensatz zur Eliashberg-Spektralfunktion erstellten und mithilfe moderner Deep-Learning-Techniken ein robustes Modell entwickelten, wodurch neue Wege für die Forschung und Entwicklung supraleitender Materialien eröffnet wurden.Diese Errungenschaft liefert nicht nur neue Methoden und Werkzeuge für die Erforschung supraleitender Materialien, sondern legt auch eine solide Grundlage für zukünftige wissenschaftliche und technologische Innovationen und Anwendungen.

BETE-NET: Deutliche Erweiterung der Grenzen der computergestützten Exploration mit begrenzten Daten

Bei der Berechnung der Elektron-Phonon-Kopplung müssen Sie sicherstellen, dass das zur Berechnung der Kohn-Sham-Wellenfunktionen verwendete k-Punkt-Netz mit dem zur Berechnung der Phononen verwendeten q-Punkt-Netz übereinstimmt. Um das Datensatzproblem zu lösen, wurde in dieser Studie zunächst ein Algorithmus zur standardisierten Auswahl von k- und q-Netzen vorgeschlagen, der Netze basierend auf den vom Benutzer bereitgestellten k- und q-Punktdichten generieren kann, anstatt ein festes Netz zur Handhabung von Materialien mit unterschiedlichen Einheitszellenvolumina zu verwenden. Mit diesem Ansatz verbesserten die Forscher nicht nur die Einheitlichkeit und Qualität der Daten, sondern stellten auch die breite Anwendbarkeit des Datensatzes sicher.Das Ergebnis ist eine umfassende Datenbank mit hochwertigen Elektron-Phonon-Berechnungen für 818 dynamisch stabile Materialien.Als nächstes teilten die Forscher die 818 dynamisch stabilen Materialien im Verhältnis 80%-20% in Trainings- und Testsätze auf.

Adresse zum Herunterladen des Datensatzes:
https://go.hyper.ai/GjZDo

Nach der Bewertung der Qualität des Datensatzes entwickelten die Forscher BETE-NET weiter, um das Deep-Learning-Problem der begrenzten Datenbankgröße zu lösen.Wie in der folgenden Abbildung gezeigt, wandelt das BETE-NET-Modell die Kristallstruktur in ein Diagramm um und kombiniert die Ordnungszahl, die Atommasse, den interatomaren Abstand und die PhDOS-Informationen der Standortprojektion durch eine Reihe von Faltungs- und Gated-Block-Operationen und generiert schließlich durch eine Pooling-Operation eine Vorhersage von α²F(ω). Durch die Einführung von PhDOS-Informationen wird die Vorhersageleistung des Modells erheblich verbessert. Dieses Design nutzt nicht nur die Informationen der Kristallstruktur voll aus, sondern kombiniert auch die Schwingungseigenschaften des Materials, wodurch das Modell bei der Vorhersage des α²F(ω) von supraleitenden Materialien genauer und zuverlässiger wird. Letztlich wurden im Rahmen der Studie 3 Varianten trainiert:

* CSO-Variante (Crystal Structure Only): das Basisnetzwerk des Modells, das für Vorhersagen nur Kristallstrukturinformationen verwendet.

* CPD-Variante (grobe PhDOS): Das Modell führt Informationen zur ortsprojizierten Phononenzustandsdichte (PhDOS) ein, wodurch die Vorhersageleistung des Modells weiter verbessert wird.

* FPD-Variante (Fine PhDOS): PhDOS wird mit einem feineren Q-Mesh berechnet, wodurch die Fähigkeit des Modells, die Schwingungseigenschaften des Materials zu erfassen, weiter verbessert wird.

BETE-NET Architektur

Bei begrenzten Daten neigen Modelle schnell zu einer Überanpassung. Obwohl beim traditionellen maschinellen Lernen davon ausgegangen wird, dass Überanpassung die Generalisierungsfähigkeit des Modells beeinträchtigt, können viele Deep-Learning-Modelle immer noch einen guten Generalisierungsfehler aufrechterhalten, wenn sie auf nahezu null Verluste trainiert werden. Dieses Phänomen wird als „Double Descent“ bezeichnet und kann als eine Form der kontrollierten Überanpassung betrachtet werden. Wie in der folgenden Abbildung dargestellt, besteht das Phänomen des doppelten Niedergangs aus drei Phasen: Klassisches Regime, Kritisches Regime und Modernes Regime. Die Verlustlandschaft jeder Phase ist in der Abbildung dargestellt. Durch die Darstellung dieser Verlustlandschaften schlagen die Forscher eine plausible Möglichkeit vor, die Verzerrung und Varianz neuronaler Netzwerke intuitiv zu interpretieren und liefern eine qualitative Erklärung für das Double-Descent-Phänomen.

Die 3 Phasen des Double-Dip-Phänomens

Diese Studie wurde durch das Screening von Materialien mit hohem Tc-Wert weiter validiert.Zunächst wurden in der Studie alle Materialien mit Tc^DFT≥5K als Hochtemperaturmaterialien definiert, und schließlich erfüllten 33 Materialien dieses Kriterium. Als nächstes wurden im Rahmen der Studie die Präzisions-Recall-Kurven für jedes Modell aufgezeichnet. Die Ergebnisse zeigen, dass die durchschnittliche Präzision (AP), die von den CPD- und FPD-Modellen erreicht wird, fast fünfmal höher ist als die eines zufälligen Klassifikators. Dies zeigt, dass diese Modelle bei der Identifizierung von Materialien mit hohem Temperaturbereich gute Ergebnisse erzielen und Zufallsklassifizierer deutlich übertreffen. Damit wird die Wirksamkeit und Zuverlässigkeit der Modelle in praktischen Anwendungen bestätigt.

Screening von Hochtemperaturmaterialien

Zusammenfassend ist das BETE-NET-Modell ein perfektes Beispiel für die perfekte Verschmelzung von domänenspezifischem Wissen und fortschrittlicher Deep-Learning-Technologie. Es kann die Eliashberg-Spektralfunktion der elektroakustischen Wechselwirkung α²F(ω) von Metallen mit begrenzten Daten effizient vorhersagen. Dadurch werden nicht nur die Grenzen der computergestützten Erforschung erheblich erweitert, sondern es wird auch erwartet, dass dies zu transformativen gesellschaftlichen Auswirkungen führt, indem es die Entdeckung neuer Supraleiter unterstützt.

Äquivariante neuronale Netze: Unterstützung der Geburt von AlphaFold in der Materialindustrie

Interessanterweise wurde kurz nach der Veröffentlichung dieser Studie, am 17. Januar,Microsoft-CEO Satya Nadella gab persönlich bekannt, dass sein MatterGen-Modell im Nature-Magazin veröffentlicht wurde.Dieses Modell kann über derzeit bekannte Materialien hinausgehen und mithilfe von KI neue Materialien für bestimmte Anforderungen entdecken. Dies markiert ein neues Paradigma im Bereich des Materialdesigns: eine Abkehr vom traditionellen Datenbank-Screening hin zur direkten Entwicklung neuer Materialien auf der Grundlage von Nachfrageaufforderungen. Einige Internetnutzer riefen aus: „Das AlphaFold der Materialwelt ist da.“

Es ist erwähnenswert, dass der Schlüssel zum MatterGen-Modell in seiner einzigartigen Diffusionsmodellarchitektur liegt. In diesem Diffusionsprozess verwendet das MatterGen-Modell ein äquivariantes fraktionales Netzwerk, das auch das in dieser Studie beim Erlernen von α²F(ω) ausgewählte Modell ist. Es ist hauptsächlich für die Wiederherstellung der ursprünglichen Kristallstruktur aus dem Diffusionsprozess, also dem Rauschunterdrückungsprozess, verantwortlich.

Das äquivariante neuronale Netzwerk fügt die äquivariante Einschränkungsanforderung auf der Grundlage des traditionellen neuronalen Netzwerks hinzu. Jede Operation im Netzwerk muss äquivariant sein, daher ist das gesamte Netzwerk eine äquivariante Abbildung. Tatsächlich sind äquivariante neuronale Netzwerke zum Mainstream der KI-Forschung im Bereich der Materialien geworden.

Im vergangenen September brachten Forscher der Tohoku-Universität in Japan und des Massachusetts Institute of Technology ein neues Tool für künstliche Intelligenz namens GNNOpt auf den Markt.Durch die Integration äquivarianter neuronaler Netzwerke gelang es GNNOpt, qualitativ hochwertige Vorhersagen anhand eines kleinen Datensatzes von 944 Materialien zu erzielen. Dabei wurden 246 Materialien mit einem Wirkungsgrad bei der Umwandlung von Solarenergie von über 32% sowie 296 Quantenmaterialien mit hohen Quantengewichten erfolgreich identifiziert, wodurch die Entdeckung von Energie- und Quantenmaterialien erheblich beschleunigt wurde.

Im vergangenen August schlug die von Xu Yong und Duan Wenhui an der Tsinghua-Universität geleitete Forschungsgruppe das DFT-Framework für neuronale Netzwerke vor.Diese Studie verwendet die Einbettung von Materialstrukturinformationen als Eingabebedingungen für das äquivariante neuronale Netzwerk und gibt dann die Hamilton-Matrix aus, wodurch die Minimierung der Verlustfunktion im neuronalen Netzwerk und die Energiefunktionsoptimierung in der Dichtefunktionaltheorie vereinheitlicht werden. Im Vergleich zu herkömmlichen Methoden des überwachten Lernens weist dieses Framework eine höhere Genauigkeit und Effizienz auf und eröffnet neue Wege für die Entwicklung von Deep-Learning-DFT-Methoden. Zuvor hatte das Forschungsteam auch die xDeepH-Methode (erweitertes DeepH) vorgeschlagen, die ein tiefes äquivariantes neuronales Netzwerk-Framework verwendet, um den DFT-Hamiltonoperator magnetischer Materialien darzustellen und so effiziente Berechnungen der elektronischen Struktur durchzuführen.

Heute führen äquivariante neuronale Netzwerke im Bereich der supraleitenden Materialien zu einem neuen Forschungsparadigma. Die Erforschung und Anwendung supraleitender Materialien beschränkt sich nicht mehr nur auf Labore, sondern wird zunehmend in die Praxis integriert und ihr Marktpotenzial wird kontinuierlich freigesetzt. Es wird prognostiziert, dass der globale Markt für supraleitende Materialien weiter wachsen und bis 2027 voraussichtlich auf 19,2 Milliarden Euro anwachsen wird. Mit der tiefen Integration von KI-Technologien wie äquivarianten neuronalen Netzwerken und supraleitenden Materialien erreichen die Menschen den „Wendepunkt“ der Technologie und läuten eine neue Ära voller unendlicher Möglichkeiten ein.