HyperAIHyperAI
Back to Headlines

Neues KI-Modell vorhersagt chemische Reaktionen präziser durch physikalische Gesetze

vor 5 Tagen

Ein neuartiger Ansatz zur Vorhersage chemischer Reaktionen mithilfe generativer KI hat erhebliche Fortschritte bei der Genauigkeit und physikalischen Plausibilität erzielt. Bisherige Versuche, große Sprachmodelle (LLMs) für die Reaktionsvorhersage einzusetzen, waren oft ungenau, da sie keine grundlegenden physikalischen Gesetze wie die Erhaltung der Masse berücksichtigten. Forscher des MIT, darunter Joonyoung Joung, Mun Hong Fong, Nicholas Casetti, Jordan Liles, Ne Dassanayake und Senior-Autor Connor Coley, haben nun ein System namens FlowER (Flow matching for Electron Redistribution) entwickelt, das diese Einschränkungen überwindet. Ihr Ansatz basiert auf einem 1970er-Jahre-Verfahren des Chemikers Ivar Ugi, das die Elektronenverteilung in Reaktionen mittels einer Bond-Electron-Matrix darstellt. Durch die explizite Verfolgung von Atomen und Elektronen – mit Nullen für fehlende Bindungen und Nichtbindungen, und nicht-null-Werten für Bindungen oder freie Elektronenpaare – gewährleistet FlowER die Erhaltung von Masse und Ladung. Dies verhindert, dass das Modell „neue Atome“ erzeugt oder bestehende löscht, wie es bei herkömmlichen LLMs oft der Fall ist. FlowER wurde anhand von über einer Million Reaktionen aus Patentdaten des US-Patentamts trainiert und erreicht bei der Vorhersage klassischer Reaktionsmechanismen Leistungen, die mit oder sogar über bestehenden Methoden liegen. Besonders hervorzuheben ist, dass das Modell nicht nur Produkte vorhersagt, sondern auch die intermediären Schritte und die elektronische Umverteilung während der Reaktion nachvollzieht. Die Forscher nutzen experimentell validierte Daten aus der Literatur, um die Mechanismen abzuleiten, anstatt sie zu erfinden – ein Ansatz, der bisher selten in dieser Skalierbarkeit und Transparenz praktiziert wurde. Die gesamte Infrastruktur, inklusive Modelle, Daten und ein vorheriges, umfassendes Dataset mechanistischer Schritte, ist frei über GitHub zugänglich, was die Forschungsgemeinschaft weltweit fördern soll. Obwohl das Modell aktuell noch nicht alle Reaktionstypen abdeckt – insbesondere Metall- und katalytische Reaktionen fehlen –, sehen die Forscher große Potenziale in Bereichen wie Arzneimittelentwicklung, Materialforschung, Verbrennung und elektrochemische Systeme. Der nächste Schritt liegt in der Erweiterung auf metallhaltige und katalytische Prozesse. Coley betont, dass FlowER zwar noch ein Beweis des Konzepts ist, aber eine wichtige Grundlage für zukünftige Entdeckungen komplexer Reaktionen und Mechanismen darstellt. Die Arbeit wurde durch das ML for Pharma Discovery and Synthesis-Konsortium und die National Science Foundation unterstützt. Industriebeobachter sehen in FlowER eine bahnbrechende Entwicklung: „Es ist ein Meilenstein, dass physikalische Gesetze in generative KI-Modelle eingebaut werden, statt sie zu ignorieren“, sagt ein Experte für computergestützte Chemie. Die Open-Source-Strategie wird als besonders wertvoll angesehen, da sie die Zusammenarbeit und Beschleunigung der Forschung fördert. MITs Ansatz könnte die Grundlage für eine neue Ära der automatisierten Reaktionsanalyse und -entwicklung bilden.

Related Links