HyperAI

Zielattributmaterialien Direkt Gestalten! Das MatterGen-Modell Von Microsoft Ist Jetzt Open Source Und Definiert Das Neue Paradigma Des Material-Reverse-Designs Mit Generativer KI Neu

特色图像

Im Dezember 2023 veröffentlichte Google DeepMind sein Deep-Learning-Modell GNoME im Bereich der Materialchemie in „Nature“ und gab an, 2,2 Millionen neue Kristallstrukturen anorganischer Materialien entdeckt zu haben. Weniger als eine Woche nach diesem Durchbruch kündigte Microsoft die Einführung von MatterGen an, einem generativen KI-Modell für Reverse Material Design, und teilte allen mit:Zukünftig wird es möglich sein, die Struktur neuer Materialien gezielt anhand der gewünschten Eigenschaften zu gestalten.

Wenn uns Googles GNoME-Modell zeigt, dass KI das Potenzial hat, in einem riesigen chemischen Bereich schnell neue Materialien zu entdecken, dann demonstriert Microsofts MatterGen die Fähigkeit generativer KI, durch Reverse Design spezifische Anforderungen präzise zu erfüllen. Die beiden zeigen unterschiedliche Einstiegspunkte der KI im Bereich der Materialchemie und markieren zudem einen neuen technologischen Sprung von der Entdeckung im großen Maßstab zum „On-Demand-Design“. Am 16. Januar wurden die Ergebnisse von MatterGen schließlich in Nature unter dem Titel „A generative model for inorganic materials design“ veröffentlicht. Noch spannender ist, dass das Modell jetzt Open Source ist.HyperAI hat auf seiner offiziellen Website das Tutorial „MatterGen Inorganic Material Design Model Demo“ veröffentlicht. Es kann mit einem Klick bereitgestellt und ausgeführt werden. Jeder ist herzlich eingeladen, die Leistungsfähigkeit des Modells zu testen.

Adresse des Tutorials:https://go.hyper.ai/5mWaL

Professor Wang Jinlan von der Southeast University wies in seinem Artikel „Inverses Design mit tiefen generativen Modellen: der nächste Schritt in der Materialforschung“ einmal darauf hin, dass in der traditionellen, maschinenlerngestützten Materialdesignforschung die meisten von ihnen die Eigenschaften von Kandidatenmaterialien im gesamten chemischen Raum vorhersagen und groß angelegte Screenings durchführen, um potenzielle Materialien mit der Zielleistung zu finden, aber inverses Design kann qualifizierte Verbindungen direkt auf dem optimalen Weg generieren. Sie ist davon überzeugt, dass generative Modelle eine effektive Strategie für das Reverse Design von Materialien darstellen, was mit der Forschung von Microsoft übereinstimmt.

MatterGen basiert auf einem Diffusionsmodell und kann Strukturen entsprechend Zielraumgruppen generieren. Beispielsweise werden beim Entwurf magnetischer Materialien mit mehreren Eigenschaften Strukturen vorgeschlagen, die sowohl eine hohe magnetische Dichte als auch eine chemische Zusammensetzung mit geringem Lieferkettenrisiko aufweisen. Gleichzeitig ist das Modell mit mehreren anpassbaren Anpassungsmodulen ausgestattet, die entsprechend Einschränkungen wie chemischen Eigenschaften, Symmetrie und Materialeigenschaften fein abgestimmt werden können, um Materialien zu erzeugen, die bestimmte magnetische, elektronische oder mechanische Eigenschaften erfüllen und diese durch DFT verifizieren. Daraus lässt sich schließen, dass die „Anpassung“ neuer Materialien an ein bestimmtes Szenario in naher Zukunft Realität werden könnte.

Zu den heute gängigen generativen Modellen zählen neben den oben genannten Diffusionsmodellen auch Generative Adversarial Networks (GANs), Variational Autoencoder (VAEs), autoregressive Modelle usw. Ihr Kernprinzip besteht darin, durch das Erlernen der Datenverteilung neue Stichproben zu generieren.

In diesem Artikel stellt HyperAI den Wert generativer Modelle beim Reverse Design neuer Materialien vor und untersucht die spezifischen Fortschritte dieser Technologie bei Batteriematerialien, Hochentropielegierungen, supraleitenden Materialien usw.

Ähnlichkeiten zwischen der Entwicklung neuer Materialien und dem Proteindesign

Bei einem typischen Materialentwicklungsproblem möchten wir ein neues Material mit bestimmten Eigenschaften finden. Dabei geht es eigentlich darum, eine geeignete Kristallstruktur zu finden, die den Zieleigenschaften entspricht.

In der Vergangenheit beruhte die Entwicklung neuer Materialien hauptsächlich auf dem Prinzip „Versuch und Irrtum“. Dieses „Vorwärtsdesign“ ist durch die Entdeckung von der Struktur hin zu den Eigenschaften gekennzeichnet. Nehmen wir als Beispiel die gängigste Substitutionsmethode: Der La-Ba-Cu-O-Supraleiter ist der älteste Supraleiter auf Kupferbasis, er ist jedoch nur bei 35 K supraleitend, also unter der Temperaturzone von flüssigem Stickstoff. Ausgehend von der Struktur ersetzten die Forscher La durch das Element Y und stellten fest, dass die Supraleitungstemperatur des Y-Ba-Cu-O-Supraleiters höher ist als die Temperaturzone von flüssigem Stickstoff. Der Forschungs- und Entwicklungszyklus dieser Methode ist jedoch sehr lang und stark von Zufällen geprägt.

Mit der Weiterentwicklung der Computertechnologie und der Quantenmechaniktheorie haben sich die auf der Dichtefunktionaltheorie (DFT) basierenden Methoden zur Materialvorhersage allmählich weiterentwickelt. In Kombination mit Struktursuchalgorithmen und Hochdurchsatz-Computing können potenzielle Materialien anhand bestimmter Einschränkungen effizient in bestimmten Datenbanken gescreent und dann zur Synthese und Prüfung an das Labor gesendet werden. Allerdings ist der chemische Raum unbekannter Materialien extrem groß und die möglichen Kombinationen verschiedener Elemente gehen sogar in die Millionen, was den Rechenaufwand für groß angelegte Screenings sehr hoch macht.

KI-gesteuertes Reverse Design ermöglicht eine neue Denkweise. Es löst sich vom Trägheitsdenken der Materialraumprüfung und generiert direkt Materialstrukturen, die die Zielleistung erfüllen, wodurch eine effiziente Gestaltung und Optimierung der Materialien erreicht wird.

Tatsächlich hat das KI-gesteuerte Reverse Design im biomedizinischen Bereich bahnbrechende Fortschritte erzielt. Im Oktober 2024 bezog sich der Nobelpreis für Chemie erstmals auf das Gebiet der KI, und die Hälfte des Preises wurde David Baker von der University of Washington in Anerkennung seiner herausragenden Beiträge zum Proteindesign verliehen. In vielen seiner Studien können wir Beispiele für seinen umgekehrten Einsatz von Deep Learning beobachten, um Aminosäuresequenzen für die Entwicklung funktionaler neuer Proteine zu generieren.

Gewinner des Nobelpreises für Chemie 2024

Es gibt viele Ähnlichkeiten zwischen der Forschung und Entwicklung neuer Materialien und dem Proteindesign. Beispielsweise werden die makroskopischen Eigenschaften eines Materials durch seine mikroskopische Struktur bestimmt, und das gleiche gilt für Proteine. Im Bereich der Proteine steuert die Aminosäuresequenz die Faltung von Proteinen in spezifische Sekundär-, Tertiär- und sogar Quartärstrukturen, die wiederum ihre biologischen Funktionen bestimmen. In ähnlicher Weise beruht die Materialwissenschaft auf der Auswahl und Anordnung von Atomen, chemischen Bindungen und funktionellen Gruppen, um Moleküle oder komplexere Materialstrukturen aufzubauen, die wiederum deren Eigenschaften bestimmen.

Diese Ähnlichkeit ermöglicht es gängigen KI-Methoden im Proteindesign, Erkenntnisse in der Materialforschung zu liefern, beispielsweise zur Optimierung von Materialeigenschaften durch inverses Design, zur Erforschung neuer Strukturen oder zur Entwicklung völlig neuer Materialien.

Gleichzeitig verfügen auch andere generative Modelle, visuelle Modelle, Sprachmodelle und andere fortschrittliche Technologien, die im biomedizinischen Bereich entstanden sind, wie etwa bestärkendes Lernen, Aufmerksamkeitsmechanismen, Diffusionsmodelle, vorab trainierte Modelle, multimodale Technologien, Modellausrichtungsmechanismen usw., über ein breites Anwendungspotenzial in der Materialwissenschaft.

Es ist erwähnenswert, dass die Möglichkeit einer tatsächlichen Umsetzung größer sein könnte, da neue Materialien nicht den langen klinischen Testzyklus der Biomedizin durchlaufen müssen und der Einfluss von Faktoren wie der ethischen Sicherheit ausgeschlossen ist.

Am Beispiel von Microsoft MatterGen untersuchen wir das neue Paradigma des generativen KI-Reverse-Designs von Materialien

Das MatterGen-Modell von Microsoft basiert hauptsächlich auf einer Diffusionsarchitektur. Dabei werden zunächst schrittweise der Atomtyp, die Atomposition und das periodische Gitter zu einer zufälligen Struktur zerstört. Anschließend wird ein Modell trainiert, diesen Vorgang in umgekehrter Reihenfolge durchzuführen. Dadurch lernt das Modell, wie die ursprüngliche Materialstruktur aus zufälligem Rauschen schrittweise wiederhergestellt werden kann. Xie Tian, der korrespondierende Autor des Papiers, glaubt, dass dies der Kernidee der Videogenerierung sehr ähnlich ist.

Am Beispiel des von OpenAI entwickelten Vincent-Videomodells Sora verwendeten die Forscher die auf dem Autoencoder basierende Technologie „Videokomprimierungsnetzwerk“, um die Eingabebilder oder -videos in Daten mit niedrigerer Dimension zu komprimieren und diese komprimierten Videos in „Raum-Zeit-Patches“ zu zerlegen, die dann zur Transformer-Verarbeitung weiter in eindimensionale Datensequenzen umgewandelt werden. Der Transformer schließt dann die Rauschentfernung jedes räumlich-zeitlichen Patches ab, und anschließend stellt der Decoder die verarbeiteten Tensordaten in einem Video wieder her.

Sora-Workflow

Andererseits ließen die Forscher das Modell basierend auf der Diffusionsarchitektur die Struktur bekannter stabiler Materialdaten erlernen. Sobald das Modell trainiert ist, kann es bedingungslos Stichproben aus der Zufallsverteilung ziehen und den umgekehrten Prozess durchlaufen, um dem Modell die Generierung neuer Materialstrukturen zu ermöglichen, die die Bedingungen basierend auf seinem Verständnis der Materialgesetze erfüllen. Darüber hinaus fügten die Forscher jeder Schicht des Netzwerks Bedingungen hinzu, um das Grundmodell zu optimieren. Diese Bedingungen können bestimmte chemische Eigenschaften, Symmetrie oder beliebige Zieleigenschaft (Magnetismus, Dichte usw.) sein. Nach der FeinabstimmungDas Modell kann Materialstrukturen entsprechend vorgegebener Bedingungen direkt generieren und deren Stabilität durch Berechnungsmethoden nachweisen.

Wie unten gezeigt, erscheinen die von MatterGen erzeugten Materialstrukturen im Fall der Erzeugung neuer Materialien für das chemische System Strontium-Vanadium-Sauerstoff sehr vernünftig (fi), und Berechnungen haben bestätigt, dass diese Materialien stabil sind.

Generieren Sie Materialien in chemischen Zielsystemen

Zusätzlich zur rechnerischen Verifizierung arbeitete das Team auch mit dem Shenzhen Institute of Advanced Technology der Chinesischen Akademie der Wissenschaften zusammen, um mithilfe von MatterGen erfolgreich ein neues Material namens TaGr zu synthetisieren.2O6Der experimentell gemessene Kompressionsmodul beträgt 169 GPa, was einen relativen Fehler aufweist, der unter dem Designwert von 200 GPa von 20% liegt. Gleichzeitig hofft das Team auch auf Feedback von Wissenschaftlern und möchte das Modell weiter iterieren und optimieren, um seinen praktischen Anwendungswert zu verbessern.

Es ist erwähnenswert, dass es bei den meisten Problemen des Materialdesigns darum geht, Materialien mit extremen Eigenschaften zu finden, wie etwa Supraleiter bei Raumtemperatur und superionische Leiter für Batterien. Daher sind herkömmliche suchbasierte Methoden schwer umzusetzen. Generative Modelle orientieren sich jedoch an den Zieleigenschaften und können Möglichkeiten zur Entdeckung dieser bahnbrechenden Materialien bieten.Microsoft nutzt dieses Modell, um eine Vielzahl von Materialien zu erforschen, die die Bereiche Batteriedesign, Solarzellendesign und Kohlenstoffabscheidung abdecken.

Weitere Anwendungen: Am Beispiel der Entwicklung von Hochentropielegierungen und supraleitenden Materialien

Wir alle wissen, dass neue Materialien nicht nur der Eckpfeiler für die Entwicklung von Hochtechnologiebereichen wie der Luft- und Raumfahrt, neuen Energien, elektronischen Informationen und Biomedizin sind, sondern auch das Rückgrat für die Unterstützung neuer Technologien, neuer Geräte und neuer Projekte. Allerdings wird die derzeitige Werkstoffindustrie meines Landes noch immer von traditionellen Werkstoffen dominiert und das Angebot an neuen Werkstoffen, insbesondere an hochwertigen neuen Werkstoffen, ist begrenzt. Gleichzeitig sind wir aufgrund des Mangels an Schlüsseltechnologien in gewissem Maße von importierten Materialien abhängig und das Problem der Einschränkungen durch die Unzulänglichkeiten der Menschen ist nach wie vor groß.

Heutzutage läutet die Materialwissenschaft mit der Entwicklung der generativen KI einen neuen Paradigmenwechsel in der Forschung ein. Wenn wir dieses neue Feld so früh wie möglich betreten, bietet sich möglicherweise die Möglichkeit, Defizite zu überwinden und hoffentlich das „Überholen in Kurven“ zu erreichen. Als Nächstes werde ich anhand spezifischer Fälle generativer KI bei der Entwicklung von Hochentropielegierungen, supraleitenden Materialien und anderen Anwendungen untersuchen, wie diese Technologie dazu beitragen kann, dass neue Materialien einen sprunghaften Entwicklungsfortschritt erzielen.

Legierung mit hoher Entropie

In technischen Anwendungen wie Gasturbinen, Kernreaktoren und Antriebssystemen für die Luft- und Raumfahrt besteht eine starke Nachfrage nach Metalllegierungen mit hervorragenden mechanischen Eigenschaften bei hohen Temperaturen. Feuerfeste Hochentropielegierungen (RHEAs) können durch Zugabe verschiedener hochschmelzender feuerfester Elemente bei Temperaturen von 1.000 °C und mehr eine hohe Festigkeit beibehalten und weisen eine Hochtemperaturfestigkeit auf, die mit der von Hochtemperaturlegierungen vergleichbar ist, was bei Forschern große Aufmerksamkeit erregt hat.

Im Vergleich zu anderen Hochtemperaturlegierungen ist die Leistung von RHEAs in bestimmten Aspekten (wie etwa der Duktilität bei Raumtemperatur) jedoch immer noch eine Herausforderung. In der Vergangenheit beruhte die Entwicklung von RHEAs größtenteils auf der Erfahrung und Intuition der Forscher, was mit großen Unsicherheiten behaftet war. Gleichzeitig ist der mögliche Zusammensetzungsraum von RHEAs groß und umfasst Milliarden von Kandidatenkomponenten, was unsere schnelle Entdeckung potenzieller Legierungen stark einschränkt.

In diesem Zusammenhang veröffentlichte Wesley Reinhart, Assistenzprofessor in der Abteilung für Materialwissenschaft und Werkstofftechnik und am Institut für Computer- und Datenwissenschaft der Pennsylvania State University, im Journal of Materials Informatics einen Artikel mit dem Titel „Generatives Deep Learning als Werkzeug für das inverse Design hochentropischer feuerfester Legierungen“ und kam zu dem vorläufigen Schluss, dass generative Modelle eine vielversprechende neue Methode für das Materialdesign darstellen, insbesondere für das Design hochentropischer Legierungen. Dieses Ergebnis wurde vom JMI als beste Arbeit des Jahres bewertet.

Papieradresse:

https://www.oaepublish.com/articles/jmi.2021.05

In diesem Artikel erwähnten die Forscher, dass Rechenmethoden wie die Dichtefunktionaltheorie (DFT) in den letzten 10 Jahren grundsätzlich ausgereifter geworden seien und große Datenmengen angesammelt hätten, die eine Grundlage für die Anwendung von Deep Learning bildeten und die Entwicklung von „Vorwärtsmodellen“ förderten. Leider stellt der riesige Gestaltungsspielraum noch immer eine große Herausforderung dar. Eine Lösung hierfür bietet das „Reverse Design“ der generativen Modellierung.

Daher verwendeten die Forscher bedingte generative kontradiktorische Netzwerke (CGANs), um den Generator mit zusätzlichen bedingten Vektoren zur Steuerung seiner Ausgabe auszustatten. Mit anderen Worten: Der bedingte Vektor kann Informationen zum Zielattribut (wie etwa Legierungszusammensetzung oder Leistungsindex) bereitstellen, eine Zuordnung zwischen dem latenten Raum und dem gewünschten Index herstellen und der Generator kann Stichproben generieren, die die Bedingungen erfüllen, indem er die Wahrscheinlichkeitsverteilung der Legierungsleistungsdaten basierend auf der Legierungszusammensetzung lernt. Erwähnenswert ist, dass das Modell erfolgreich für Aluminiumlegierungen entwickelt und mit rechnerischen Methoden verifiziert wurde.

Schematische Darstellung der generativen Modellierung für Material Reverse Design mit bedingtem GAN

Erwähnenswert ist, dass die Forscher auch erwähnten, dass neben der Verwendung von CGAN auch der Conditional Variational Autoencoder (CVAE) für das Design neuer Materialien verwendet werden kann. Aufgrund der inhärenten Rauscheinfügung im Trainingsprozess und der vordefinierten Messanforderungen für Rekonstruktionsfehler ist VAE jedoch nicht so effektiv wie GAN.

Supraleitende Materialien

Supraleitende Materialien sind Leiter, die bei einer bestimmten Temperatur keinen Widerstand aufweisen. Ihr Anwendungsspektrum ist breit gefächert und umfasst die Bereiche Kraftübertragung, Motoren, Transport, Luft- und Raumfahrt, Mikroelektronik, elektronische Computer, Kommunikation, Kernphysik, neue Energien, Biotechnik, medizinische Versorgung und militärische Ausrüstung. Seit der Entdeckung des Phänomens der Supraleitung wurden auf diesem Gebiet zahlreiche Nobelpreise verliehen.

Die Entdeckung neuer Supraleiter mit hoher kritischer Temperatur (Tc) war schon immer eine wichtige Aufgabe in den Bereichen Materialwissenschaften und Festkörperphysik. Das National Institute of Standards and Technology und andere Forscher von Microsoft haben ein neues Diffusionsmodell zur Erzeugung von Supraleitern mit einzigartigen Strukturen und chemischen Zusammensetzungen vorgeschlagen. Die Forschungsarbeit trug den Titel „Inverse Design of Next-generation Superconductors Using Data-driven Deep Generative Models“ und wurde im Journal of Physical Chemistry Letters veröffentlicht.

Papieradresse:

https://pubs.acs.org/doi/10.1021/acs.jpclett.3c01260

In dieser Arbeit erwähnten die Forscher, dass die größte Herausforderung bei der Anwendung generativer Modelle auf periodische Materialien darin besteht, Darstellungen zu erstellen, die translations- und rotationsinvariant sind, ein Problem, das mithilfe eines kristallbasierten diffusen Variational Autoencoders (CDVAE) gelöst werden kann.

Vollständiger inverser Design-Workflow für neuartige Supraleiter mithilfe der DFT-, ALIGNN- und CDVAE-Modellgenerierung

Daher trainierten die Forscher, wie in der Abbildung oben gezeigt, das CDVAE-Modell mit DFT-Daten von 1.058 supraleitenden Materialien, um 3.000 neue Kandidatenmaterialien für die Supraleitung zu generieren. Anschließend wurde das vorab trainierte Deep-Learning-Modell ALIGNN verwendet, um die supraleitenden Eigenschaften dieser Kandidatenstrukturen vorherzusagen, und nach der Prüfung wurden 61 Kandidatenmaterialien erhalten. Abschließend führten die Forscher DFT-Berechnungen an diesen Materialien durch, um die Vorhersagen zu überprüfen und die dynamische und thermodynamische Stabilität der neuen Materialien zu bewerten. Die Strukturen von 15 potenziellen Kandidaten für supraleitende Materialien sind in der folgenden Abbildung dargestellt. Die Studie ergab, dass ein solcher Ansatz das umgekehrte Design der nächsten Materialgeneration ermöglicht.

Drauf- und Seitenansichten der besten supraleitenden Kandidaten (die der konvexen Hülle am nächsten liegen), generiert durch CDVAE und verifiziert durch DFT

Natürlich wurden generative Modelle zusätzlich zu den oben genannten Fällen auch in anderen Materialdesigns angewendet. Der Autor hat einige Fälle speziell zu Ihrer Information zusammengestellt.

*Lithiumbatterie-Design

Titel des Papiers: Li-Ionen-Batteriedesign durch mikrostrukturelle Optimierung mittels generativer KI

Papieradresse:

https://www.cell.com/matter/fulltext/S2590-2385(24)00446-6

*Nanokomposit-Materialdesign

Titel des Papiers: Generative KI für maßgeschneiderte Funktionalitäten in Nanokompositmaterialien

Papieradresse:

https://easychair.org/publications/preprint/sDm2

*2D-Materialdesign

Titel der Abschlussarbeit: Computergestützte Entdeckung neuer 2D-Materialien mithilfe generativer Deep-Learning-Modelle

Papieradresse:

https://pubs.acs.org/doi/abs/10.1021/acsami.1c01044

*Entwurf von technischen Verbundwerkstoffen auf Zementbasis

Titel des Papiers: Generative KI für leistungsbasiertes Design von technischen Zementverbundwerkstoffen

Papieradresse:

https://www.sciencedirect.com/science/article/abs/pii/S1359836823004961

*Mechanisches und biomimetisches Materialdesign

Titel des Papiers: Verbesserung mechanischer und bioinspirierter Materialien durch generative KI-Ansätze

Papieradresse:

https://www.sciencedirect.com/science/article/pii/S2949822824001722

Letzte Worte

Derzeit befinden sich viele Anwendungen generativer KI im Materialdesign noch im experimentellen Stadium. Um die Technologie wirklich umzusetzen, ist es neben der Bewertung der Materialeigenschaften durch Berechnungen auch notwendig, sich auf eine experimentelle Überprüfung in der Praxis zu verlassen. In dieser Hinsicht ist der Aufbau automatisierter Labore und die Erzielung geschlossener Entdeckungsschleifen besonders wichtig, wenn wir die Lücke zwischen computergestütztem Screening und experimenteller Synthese neuer Materialien schließen und Materialien schnell und mit minimalem Personalaufwand entdecken möchten.

Nehmen Sie als Beispiel das A-Lab, ein automatisiertes Labor an der University of California, Berkeley. Es kann nicht nur Versuchsschritte automatisiert ausführen, sondern auch selbstständig Entscheidungen auf Basis von Daten treffen. In 17 Tagen Dauerbetrieb wurden 41 von 58 Zielmaterialien erfolgreich synthetisiert, mit einer Erfolgsrate von 71%. Dies zeigt, dass die Verwendung generativer KI zum Entwerfen von Materialien und zur Durchführung effizienter Synthese und Verifizierung in automatisierten Laboren zu einem wirksamen Mittel wird, um die schnelle Entwicklung der Materialwissenschaften voranzutreiben.

Quellen:
1.https://nullthought.net/?p=5222&utm_source=chatgpt.com
2.https://academic.oup.com/nsr/article/9/8/nwac111/6605930?login=false
3.https://mp.weixin.qq.com/s/UX71cMgsEo49tLPiFu3D8A
4.https://mp.weixin.qq.com/s/e1DqTa1Tgyi4OWpgwrj48Q
5.https://www.youtube.com/watch?v=Smz1go6_Spo&t=896s
6.https://www.youtube.com/watch?v=yWXPV3bsC2c&t=7s
7.https://www.youtube.com/watch?v=Uv22eVcmmXA