Die Forschungsgruppe Von Li Honglin an Der East China University of Science and Technology Entwickelt Macformer, Um Die Entdeckung Makrozyklischer Medikamente Zu Beschleunigen

Makrozyklische Verbindungen sind kleine Moleküle oder Peptide, die aus mehr als 12 Atomen bestehen. Im Vergleich zu anderen niedermolekularen Verbindungen weisen makrozyklische Verbindungen viele Vorteile hinsichtlich ihrer Struktur und Leistung auf und gelten daher als potenzielle Therapeutika für verschiedene Zielmoleküle.
Makrozyklische Analoga auf Basis medizinalchemischer Synthese sind eine Hauptquelle für makrozyklische Arzneimittel. Aufgrund fehlender Synthesemethoden, hoher Syntheseschwierigkeiten und geringer Referenzmaterialien wurde der Entwicklung makrozyklischer Arzneimittel jedoch wenig Aufmerksamkeit geschenkt.
Zu diesem Zweck hat die Forschungsgruppe von Li Honglin an der East China University of Science and Technology Macformer auf Basis von Transformer entwickelt. Macformer hat das azyklische Medikament Feizotinib erfolgreich makrozyklisiert, um neue Verbindungen mit stärkerer Wirksamkeit zu erhalten und so einen neuen Ansatz für die Medikamentenentwicklung zu bieten.
Autor | Xuecai
Herausgeber | Sanyang
Die Geschichte der makrozyklischen Medikamente
Makrozyklen sind kleine Moleküle oder Peptide, die aus mehr als 12 Atomen bestehen.. Dieser Verbindungstyp weist ein hohes Molekulargewicht und eine große Anzahl von Wasserstoffbrückenspendern auf und verfügt über eine stärkere Affinität, Selektivität und bessere pharmakologische Eigenschaften.Makrozyklische Medikamente gelten als potenzielle Therapeutika für verschiedene Ziele, wie Kinasen, Proteasen und G-Protein-gekoppelte Rezeptoren.

Neben natürlichen makrozyklischen Arzneimitteln sind auch Analoga auf Basis pharmazeutisch-chemischer Synthese eine wichtige Quelle für makrozyklische Arzneimittel.Durch die Makrozyklisierung bekannter azyklischer Arzneimittel können neue makrozyklische Arzneimittel direkt und effektiv gewonnen werden.und die gewünschten pharmakologischen Eigenschaften zu erzielen. Jedoch,Aufgrund des Mangels an synthetischen Methoden und der hohen Schwierigkeit der Synthesemakrozyklische Arzneimittel werden bei der Arzneimittelentwicklung immer noch wenig beachtet.
Derzeit beruht die Makrocyclisierung linearer Moleküle hauptsächlich auf empirischen Schlussfolgerungen. Darüber hinaus bleiben der Synthese- und Inferenzprozess des Arzneimittels immer vage, auch wenn in der Literatur die endgültigen Syntheseergebnisse präsentiert werden. Der undurchsichtige und nicht standardisierte Syntheseprozess hat die Hürde für die Branche erhöht und die Entwicklung makrozyklischer Arzneimittel behindert.
Obwohl Deep Learning in verschiedenen Phasen der Arzneimittelentwicklung großes Potenzial gezeigt hat,Das Training neuronaler Netze erfordert jedoch viele Daten. Angesichts der Tatsache, dass es weniger als 90 klinisch zugelassene makrozyklische Arzneimittel gibt, gibt es keine Forschung zur Makrozyklisierung von Arzneimitteln unter Verwendung von Deep-Learning-Algorithmen.
zu diesem Zweck,Die Forschungsgruppe von Li Honglin an der East China University of Science and Technology entwickelte Macformer basierend auf Transformer, um eine Makrocyclisierung linearer Moleküle zu erreichen. Sie erweiterten die Daten, indem sie dieselbe Verbindung mithilfe verschiedener vereinfachter molekularer linearer Eingabespezifikationen (SMILES) darstellten.
Anschließend wurde am Beispiel von Fedratinib, einem von der US-amerikanischen Food and Drug Administration (FDA) zugelassenen JAK2-Inhibitor, Macformer verwendet, um diesen makrozyklisch zu spalten und so eine neue makrozyklische Verbindung zu erhalten.Diese Verbindung hat eine bessere Selektivität und pharmakokinetische Eigenschaften, sodass die erforderliche Dosis niedriger ist als die von Fuzotinib. Dieses Ergebnis wurde in „Nature Communication“ veröffentlicht.

Holen Sie sich das Papier:https://www.nature.com/articles/s41467-023-40219-8
Folgen Sie dem offiziellen Konto und antworten Sie mit „makrozyklische Medikamente“, um das vollständige Dokument als PDF zu erhalten.
Experimentelle Verfahren
Datensatz:Datenerweiterung des ChEMBL-Datensatzes
Zunächst sammelten die Forscher 18.357 biologisch aktive makrozyklische Verbindungen aus der ChEMBL-Datenbank und untersuchten sie. Anschließend werden zwei beliebige chemische Bindungen der makrozyklischen Verbindung durchlaufen und ihre Linker aufgespalten, um die entsprechende azyklische Verbindung zu finden.Schließlich wurden insgesamt 237.728 Paare makrozyklischer-azyklischer Verbindungen als Datensatz für diese Studie erhalten..

Jede Verbindung hat einen spezifischen SMILES-Ausdruck. Neuere Studien haben jedoch gezeigt, dassModelltraining mit einer Reihe zufälliger SMILES-Ausdrücke, die chemisch identisch, aber syntaktisch unterschiedlich sind, wodurch die Leistung von Deep-Learning-Modellen erheblich verbessert werden kann. Die Forscher verglichen die um das 2-, 5- und 10-fache erweiterten Daten mit den Originaldaten und alle Daten zeigten nach 50.000 Schritten eine gute Konvergenz.

Modellarchitektur:Transformator-Kodierung und -Dekodierung
Macformer basiert auf der Transformer-Architektur. Die SMILES-Sequenzen der Eingabe- und Zielverbindungen werden in eine trainierbare Matrix eingebettet und mithilfe von Sinus- und Cosinusfunktionen positionscodiert.
Die Einbettungsmatrix der Eingabeverbindung wird in den Encoder eingespeist, um eine latente Darstellung zur Initialisierung des Codierungsprozesses zu generieren. Jede Encoderschicht besteht aus einer Multi-Head-Attention-Schicht und einem Positions-Feedforward-Netzwerk.
Das ultimative Ziel von Macformer besteht darin, die Lücke zwischen der vorhergesagten Sequenz und der entsprechenden Zielsequenz durch die Kreuzentropieverlustfunktion zu minimieren und die vorhergesagte makrozyklische Verbindung auszugeben..

Vergleichsstudie:ChEMBL-Datensätze
Die Forscher verglichen Macformer mit einem Nicht-Deep-Learning-Modell, MacLS. Nach der Eingabe einer azyklischen Verbindung können beide ein makrozyklisches Analogon ausgeben. daher,Die chemische Validität, Neuheit und Einzigartigkeit der Makrozyklen werden als Bewertungskriterien für die Modellleistung verwendet..
Im Vergleich zum ursprünglichen Datensatz verbesserte die zweifache Erweiterung des Datensatzes die Gesamtleistung des Modells, insbesondere in Bezug auf die Wiederherstellungsrate (96,091 TP3T gegenüber 54,851 TP3T), die Wirksamkeit (80,341 TP3T gegenüber 66,741 TP3T) und die Neuheit des Konnektors (58,911 TP3T gegenüber 40,561 TP3T), während eine weitere Erweiterung des Datensatzes die Leistung des Modells nicht weiter verbesserte.

MacLS_self generiert Konformationen de novo mithilfe von azyklischen SMILES, während MacLS_extra Konformationen aus energiearmen 3D-Strukturen von Zielmakrozyklen extrahiert.
Die Wirksamkeit von MacLS_self beträgt nur 17,05%, während die Neuartigkeit und Einzigartigkeit der Verbindung von MacLS_extra die von Macformer übertrifft. MacLS kann jedoch nur nach Connectons aus dem Trainingssatz suchen, sodass der Neuigkeitswert der Connectons 0 beträgt. Darüber hinaus ist die Wiederherstellungsrate makrozyklischer Verbindungen durch MacLS ebenfalls sehr niedrig, weniger als 5%.
Vergleichsstudie:ZINC-Datensatz
Darüber hinaus werden die beiden Modelle anhand des externen Datensatzes ZINC verglichen. Das mit einem 5-fach erweiterten Datensatz trainierte Macformer-Modell weist eine Wiederherstellungsrate von mehr als 80%, eine Effektivität von mehr als 84% und eine Neuartigkeit von mehr als 99% auf.Die obigen Ergebnisse zeigen, dass Macformer nach der Datenerweiterung über hervorragende Generalisierungsmöglichkeiten verfügt.

Da MacLS nicht über die Lernfähigkeit von Macformer verfügt, sind seine Ergebnisse bei verschiedenen Datensätzen grundsätzlich ähnlich.
Chemikalienverteilung:Macformer ist eher eine Eingabe
Unabhängig von der Neuartigkeit des Linkers sind sowohl Macformer als auch MacLS in der Lage, neue Makrozyklen zu generieren. Daher verglichen die Forscher die Verteilung der von beiden erzeugten Verbindungen im chemischen Raum.
Zunächst wurden die Ähnlichkeiten zwischen den Verbindungen mithilfe des Tanimoto-Koeffizienten verglichen. Aufgrund der strukturellen Ähnlichkeiten zwischen azyklischen und makrozyklischen Verbindungen liegen die Tanimoto-Koeffizienten der meisten vom Modell generierten Verbindungen über 0,7. Allerdings war die strukturelle Ähnlichkeit der von Macformer erzeugten Verbindungen mit den Originalverbindungen größer als die von MacLS_extra.

Dieses Ergebnis ist etwas ungewöhnlich, da Macformer in der Lage ist, Konnektoren abzuleiten, die im Trainingssatz nicht vorhanden sind, während MacLS diese Fähigkeit nicht besitzt. Zu diesem Zweck verwendeten die Forscher den Unified Manifold Approximation and Projection Algorithm (UMAP), um die Datendimensionalität zu reduzieren. Die Ergebnisse zeigen, dassDie neuen von Macformer generierten Linker werden in der Nähe des ChEMBL-Trainingssatzes verteilt..
Experimentelle Überprüfung
Arzneimittelentwicklung:Makrozyklisierung von Fuzotinib
In den letzten Jahren haben makrozyklische Verbindungen als potenzielle Kinaseinhibitoren viel Aufmerksamkeit auf sich gezogen. Um die Vorhersageleistung des Modells zu überprüfen, verwendeten die Forscher Macformer, um JAK2-Inhibitoren zu entwickeln. JAK2 gehört zur JAK-Familie der Kinasen und ist ein wichtiges Ziel für die Behandlung myeloproliferativer Neoplasien und rheumatoider Arthritis.
Als Eingabe für das Modell diente Fuzotinib, ein niedermolekulares Arzneimittel zur Behandlung von Myelofibrose. Filtratinib hat eine bessere Selektivität für JAK2 als andere JAK-Kinasen, aber eine schlechte Selektivität für andere Kinasen, was zu anderen Nebenwirkungen führt.
Die Anknüpfungspunkte für die Makrocyclisierung wurden auf die beiden terminalen Phenylringe gesetzt und das tert-Butylxanthamid, das den Kontakt mit der Asp994-Zielstelle beeinträchtigen könnte, wurde entfernt. Um die Vielfalt der vorhergesagten makrozyklischen Medikamente zu erhöhen, wurde jede SMILES-Quellsequenz zehnmal erweitert.Letztendlich lieferte Macformer 10.700 Ergebnisse, darunter 281 neue makrozyklische Medikamente.

Nachdem die Forscher die Bindung makrozyklischer Arzneimittel an Zielmoleküle und die Durchführbarkeit der Synthese bewertet hatten, wählten sie schließlich drei Verbindungen für synthetische Bewertungstests aus.Unter diesen wurde der Linker der Verbindung 1 bei der Entwicklung makrozyklischer Arzneimittel oder JAK2-Inhibitoren nicht erwähnt..
Unter den 300 makrozyklischen Medikamenten, die von MacLS entwickelt wurden,Diese 3 Verbindungen wurden nicht gefunden, was erneut das Potenzial von Deep-Learning-Algorithmen bei der Entwicklung neuer Medikamente beweist.
In-vitro-Bewertung:Aktivität auf Enzym- und Zellebene
Anschließend wurden die Aktivitäten dieser drei Verbindungen gegen JAK2 bewertet.Die halbhemmenden Konzentrationen (IC50) betrugen 0,07, 0,364 bzw. 0,006 μM. . Die Spezifität der wirksamsten Verbindungen 1 und 3 wurde bei 100 μM untersucht. Dabei wurden nur 10 bzw. 17 Wildtyp-Kinasen gehemmt, während 34 Wildtyp-Kinasen durch Ferritinib beeinflusst wurden. Dies deutet darauf hin, dass die Verbindungen 1 und 3 selektiver waren.

Inzwischen wurden auch die antiproliferativen Eigenschaften der Verbindungen 1–3 gegenüber JAK2-abhängigen Zellen untersucht. Die Ergebnisse zeigen, dassDie Verbindungen 1 und 3 können die Proliferation von JAK2-abhängigen Zellen bei einer niedrigeren Dosis als Fuzotinib hemmen.
In-vivo-Bewertung:Pharmakokinetische Tests
Schließlich wurde die Pharmakokinetik (PK) der Verbindungen 1, 3 und Fuzetinib nach intravenöser (iv, 5 mg/kg) und oraler (po, 5 mg/kg) Verabreichung untersucht.
Verbindung 3 war Fuzotinib in allen Aspekten außer der Bioverfügbarkeit überlegen (9,4% vs. 11,7%). Gleichzeitig weist Verbindung 1 auch Vorteile hinsichtlich der oralen Eigenschaften auf, wie etwa der systemischen Exposition (106,00 vs. 50,19 h*ng/ml) und der Bioverfügbarkeit (14,1% vs. 11,7%). Die obigen Ergebnisse zeigen, dassDie Makrozyklisierung trägt zur Verbesserung der metabolischen Stabilität von Arzneimitteln vom Fuzotinib-Typ bei.

In-vivo-Tests:Verbindung 3 hemmt Entzündungen
Es wurde berichtet, dass eine Überexpression von JAK2 zu entzündlichen Darmerkrankungen (IBD) führen kann, was bedeutet, dass die Hemmung der Aktivität von JAK2 bei der Behandlung von IBD hilfreich sein kann.Die Forscher testeten makrozyklische Medikamente an Mausmodellen, um ihre Rolle bei der Behandlung von IBD zu bewerten.
Den Ergebnissen der pharmakokinetischen Tests zufolge war die Dosierung von Feizotinib doppelt so hoch wie die von Verbindung 3. Die Ergebnisse zeigten, dass sowohl Verbindung 3 als auch Fuzetinib den durch IDB verursachten Gewichtsverlust linderten und der Krankheitsaktivitätsindex der Versuchsgruppe ab dem 8. Tag signifikant reduziert war.
Schließlich wurde die HE-Färbung verwendet, um den Schweregrad der Entzündung zu analysieren. Die Kontrollgruppe zeigte eine signifikante Entzündungsreaktion, einschließlich Entzündungszellinfiltration und Becherzellverlust, während die Entzündungsreaktion im Experiment milder war und die Dickdarmstruktur intakt war.

Die obigen Ergebnisse zeigen, dass die von Macformer abgeleiteten makrozyklischen Verbindungen herkömmlichen Arzneimitteln in Bezug auf Pharmakokinetik und Selektivität überlegen sind und eine Krankheitsbehandlung mit niedrigeren Dosen ermöglichen.
Hohe Wirksamkeit, schwierige Synthese, Freude und Leid makrozyklischer Ringe
Ab 2020Die US-amerikanische Food and Drug Administration (FDA) hat 67 makrozyklische Medikamente zugelassen, was 41 % aller zugelassenen Medikamente entspricht. . Darunter sind 59 natürliche makrozyklische Arzneimittel und nur 8 sind nicht-natürlich. Im Jahr 2008 genehmigte die FDA das erste nicht-natürliche makrozyklische Medikament, Plerixafor, zur Krebsbehandlung.
Die Hauptindikationen für makrozyklische Medikamente sind Infektionskrankheiten mit 44,41 TP3T, gefolgt von Tumoren (20,81 TP3T) und Antimykotika (8,31 TP3T). In den letzten Jahren hat der Einsatz makrozyklischer Arzneimittel im Bereich der Tumorbekämpfung dramatisch zugenommen. Vor 2007 waren es nur vier, seither wurden elf genehmigt.

Makrozyklische Arzneimittel können vielfältige Funktionen und komplexe chemische Strukturen in einer halbstarren, vororganisierten Struktur bereitstellen, wodurch die Affinität und Selektivität makrozyklischer Arzneimittel für Ziele erhöht werden kann, an die sich herkömmliche kleine Moleküle nur schwer binden können, wodurch die Wirksamkeit der Arzneimittel verbessert wird. Darüber hinaus sind einige makrozyklische Arzneimittel in der Lage, ihre Konformation an die äußere Umgebung anzupassen. Diese Fähigkeit erhöht seine Wasserlöslichkeit und Zelldurchlässigkeit.
Jedoch,Die Synthese makrozyklischer Medikamente ist sehr kompliziert. Während die makrozyklische Struktur die Fähigkeit zur Bindung an spezifische Ziele verbessert, führt sie auch zu Ringspannung, räumlichen Wechselwirkungen und nichtkovalenten Wechselwirkungen zwischen den Ringen.Dies erschwert die Vorhersage der Molekülstruktur und -eigenschaften..
KI wird zunehmend in der Arzneimittelentwicklung eingesetzt. Allerdings ist die Leistungsfähigkeit der KI oft durch begrenzte Daten begrenzt. In dieser StudieDie Forscher führten eine Datenerweiterung mit zufälligen SMILES-Ausdrücken durch,Während die Reichhaltigkeit des Datensatzes sichergestellt wird, wird die Vorhersageleistung von Macformer verbessert.
Da das Verständnis der Menschen für die Struktur und Eigenschaften von Medikamenten in Zukunft immer größer wird, wird die KI in Zukunft eine stärkere Rolle bei der Entwicklung neuer Medikamente spielen und so die Gesundheit der Menschen schützen.
Referenzlinks:
[1]https://www.cambridgemedchemconsulting.com/resources/hit_identification/macrocycles/macrocycles.html
[2]https://pubs.acs.org/doi/10.1021/acs.jmedchem.3c00134