HyperAIHyperAI
Back to Headlines

ReaSyn: KI-Modell für nachweisbare Molekülsynthesen mit Kettenreaktions-Logik

vor einem Monat

NVIDIA hat ReaSyn vorgestellt, ein neuartiges generatives KI-Modell zur Vorhersage chemischer Synthesepfade, das die Herausforderung der Synthetisierbarkeit in der Molekülgestaltung adressiert. Ein zentrales Problem in der Arzneimittelentwicklung, Chemie und Materialwissenschaft ist, dass selbst vielversprechende Moleküle wertlos sind, wenn sie nicht herstellbar sind. ReaSyn löst dies, indem es synthetische Wege als „Kette der Reaktion“ (Chain of Reaction, CoR) modelliert – eine lineare Sequenz, in der jeder Schritt Reaktanten, eine Reaktionsregel und das Produkt explizit angibt. Diese Darstellung ist inspiriert von der Chain-of-Thought-Logik von großen Sprachmodellen (LLMs), die komplexe Probleme schrittweise lösen. ReaSyn nutzt SMILES-Strings zur Darstellung von Molekülen und spezielle Token für Reaktionsklassen, wodurch das Modell nicht nur die Endprodukte, sondern auch die Zwischenstufen präzise erlernen kann. Das Modell arbeitet als autoregressives generatives System, das Schritt für Schritt von einfachen Bausteinen ausgehend einen Syntheseweg aufbaut – ähnlich wie ein Chemiker logisch vorgeht. Durch die Integration eines Reaktions-Executors wie RDKi werden Zwischenprodukte automatisch berechnet, was sowohl das Training verbessert als auch die Genauigkeit der Pfadgenerierung erhöht. ReaSyn kombiniert diese Struktur mit fortschrittlichen KI-Techniken: Es nutzt Reinforcement Learning (GRPO) mit outcome-basierten Belohnungen, um verschiedene Synthesepfade zu erkunden, ohne dass jeder Schritt belohnt wird – dies fördert Vielfalt und Kreativität. Zudem setzt es test-time-Search-Methoden wie Beam Search ein, um gezielte Optimierungen durchzuführen, beispielsweise auf Basis von molekularer Ähnlichkeit oder gewünschten Eigenschaften. In Benchmark-Tests übertraf ReaSyn bestehende Ansätze deutlich: Bei der Retro-Synthese erreichte es eine Erfolgsrate von 76,8 %, gegenüber 25,2 % bei SynNet. Bei der synthesierbaren Zieloptimierung (PMO) erreichte die Kombination mit Graph GA eine durchschnittliche Score-Verbesserung auf 0,638 – die beste Leistung aller verglichenen Methoden. Zudem zeigt ReaSyn hohe Flexibilität bei der Synthesefähigen Hit-Expansion: Es kann für ein Zielmolekül mehrere synthetisierbare Analoga im benachbarten chemischen Raum vorschlagen, was für die Entdeckung neuer Wirkstoffkandidaten entscheidend ist. Industrieexperten sehen in ReaSyn einen Meilenstein für die KI-gestützte Arzneimittelentwicklung. Es überwindet eine zentrale Schwäche traditioneller generativer Modelle, die oft unrealistisch synthetisierbare Moleküle erzeugen. Durch die Integration von LLM-ähnlicher Schlussfolgerung, test-time-Search und belohnungsorientiertem Lernen bietet ReaSyn eine realistischere, vielseitigere und effizientere Lösung für die Navigation im kombinatorisch riesigen chemischen Raum. NVIDIA stellt das Modell als Open-Source auf GitHub zur Verfügung, und die dazugehörige Forschungspublikation ist auf arXiv verfügbar. ReaSyn könnte künftig den gesamten Prozess der Wirkstoffentwicklung beschleunigen und die Brücke zwischen theoretischer Molekülgestaltung und praktischer Synthese schließen.

Related Links

ReaSyn: KI-Modell für nachweisbare Molekülsynthesen mit Kettenreaktions-Logik | Neueste Nachrichten | HyperAI