HyperAI

Um Die Wirkstoffe Natürlicher Arzneimittel Vollständig Zu Erforschen, Baute Das Team Von Professor Liu Shao Von Der Central South University Die IMN4NPD-Plattform

特色图像


Im Jahr 1806 isolierte der damals 23-jährige deutsche Apotheker Sertürner erstmals monomeres Morphin aus Schlafmohn und markierte damit den Beginn der modernen Naturstoffchemieforschung. Auf dieser Grundlage gelang dem deutschen Chemiker Friedrich Wöhler im Jahr 1828 die künstliche Synthese von Harnstoff, was zugleich die offizielle Geburtsstunde der organischen Chemie markierte. Man kann sagen, dass die kontinuierliche Forschung der Menschheit zu bioaktiven Naturprodukten (NPs) zur Entstehung der Disziplin der organischen Chemie geführt hat.

Bei den sogenannten bioaktiven Naturprodukten (NPs) handelt es sich um materielle Einheiten, die sich über einen langen Zeitraum in der Natur entwickelt haben und eine wichtige Quelle für die Forschung und Entwicklung bioaktiver Substanzen und praktischer Medikamente darstellen. Im Arzneimittelentwicklungsprozess haben NPs große Beiträge zur Innovation von Therapeutika gegen Krebs und Infektionskrankheiten geleistet. Bis heute gibt es bei der Prüfung, Trennung, Charakterisierung und Optimierung von NPs jedoch noch immer technische Hürden. Eine der größten Herausforderungen stellt dabei die Trennung von NPs aus komplexen Gemischen dar, die auch zu einem großen Engpass in der Arzneimittelforschung geworden ist.

Um diesen Engpass zu beheben,  Das Team von Professor Liu Shao von der Abteilung für Pharmazie des Xiangya-Krankenhauses der Central South University hat auf innovative Weise einen integrierten molekularen Netzwerk-Workflow für die NP-Dereplikation (IMN4NPD) entwickelt, mit dem die pharmakologischen Komponenten natürlicher Arzneimittel umfassend untersucht werden können.Es beschleunigt nicht nur die Dereplikation umfangreicher Cluster in molekularen Netzwerken, sondern bietet auch Anmerkungen zu Selbstschleifen und gepaarten Knoten, die bei bestehenden Forschungsmethoden oft übersehen werden. Die entsprechenden Forschungsergebnisse wurden kürzlich in Analytical Chemistry, einer Zeitschrift der American Chemical Society (ACS), veröffentlicht.

Papieradresse:
https://doi.org/10.1021/acs.analchem.3c04746
Folgen Sie dem offiziellen Konto und antworten Sie mit „Natural Medicine“, um das vollständige PDF zu erhalten

IMN4NPD: Integration mehrerer Rechenwerkzeuge zur Steuerung molekularer Netzwerke auf Basis spektraler Ähnlichkeit

Das zentrale Funktionsprinzip von IMN4NPD ist die molekulare Vernetzung, die durch spektrale Ähnlichkeit gesteuert wird.Es unterstützt Forscher dabei, schnell bestimmte Klassen von Verbindungen zu identifizieren, indem es mehrere Computertools wie NPClassifier, molDiscovery und t-SNE-Netzwerke integriert und koordiniert und gleichzeitig die Annotation molekularer Netzwerkknoten vereinfacht.
* NPClassifier: Ein Tool zur Klassifizierung der Struktur natürlicher Produkte basierend auf tiefen neuronalen Netzwerken
* molDiscovery: Eine Suchmethode für Massenspektrometrie-Datenbanken

Generell lässt sich der IMN4NPD-Workflow in drei Schritte unterteilen:

erster Schritt,Rohe LC-MS-Daten wurden vorverarbeitet, um molekulare Netzwerke oder merkmalsbasierte molekulare Netzwerke zu generieren. Anschließend klassifiziert SIRIUS, ein NP-Klassifizierungstool auf Basis tiefer neuronaler Netzwerke, die zusammengesetzten Klassen systematisch mithilfe von NPClassifier.

Schritt 2:In dieser Studie wurden Dereplikationsexperimente auf der Grundlage von MS/MS-Spektraldatenbanken über GNPS (Global Natural Product Social Molecular Networking) durchgeführt und anschließend eine computerdatenbankbasierte Dereplikation über molDiscovery durchgeführt.

Schritt 3.Die Forscher nutzten die Ähnlichkeit der MS/MS-Spektralmerkmale, um ein t-SNE-Netzwerk zu generieren, und klassifizierten die Verbindungen an jedem Knoten chemisch, um bestimmte Verbindungsklassen, die im selbstzirkulierenden Netzwerk verteilt sind, genau zu lokalisieren und zu replizieren.

IMN4NPD-Workflow-Diagramm

Usability-Bewertung: Untersuchung von Isochinolin-Analoga zur schnellen Identifizierung spezifischer Verbindungscluster in molekularen Netzwerken

Um die Leistung und Vorteile des IMN4NPD-Workflows zu bewerten, wurde in dieser Studie der Ethanolextrakt des Lotussamenkerns erneut analysiert. Der Kern eines Lotussamens ist der Embryoteil der Lotusschale. Es handelt sich um eine traditionelle chinesische Heilpflanze, die reich an verschiedenen Alkaloiden wie Dibenzylisochinolin, Monobenzylisochinolin und Aporphin ist. Es kann zur Behandlung von Schlaflosigkeit, Spermatorrhoe, Herzfrequenzstörungen, Bluthochdruck und anderen Symptomen verwendet werden.

Basierend auf einer experimentellen MS/MS-Spektraldatenbank wurden in dieser Studie zunächst einzelne Knoten im molekularen Netzwerk chemisch klassifiziert und so schnell spezifische Verbindungscluster im molekularen Netzwerk identifiziert, um neue Isochinolin-Analoga zu erforschen. Nach der Überprüfung der chemischen Klassifizierungsergebnisse jeder Merkmalszuordnung im molekularen Netzwerk stellten die Forscher fest, dass es einfach war, bestimmte Verbindungscluster zu finden, die Isochinolinanaloga entsprachen. Gleichzeitig waren Isochinolinverbindungen im molekularen Netzwerk hauptsächlich in vier Clustern verteilt.

Verbreitungskarte der Isochinolinverbindungen

Die Studie ergab außerdem, dass mithilfe experimenteller MS/MS-Spektraldatenbanken wie der GNPS-Datenbank nur eine begrenzte Anzahl von Merkmalen in großen Clustern erfolgreich reproduziert werden kann. daher,In dieser Studie wurde der hochmoderne In-Silico-Fragmentalgorithmus molDiscovery zum strukturellen Datenbankabgleich verwendet.Dieser Deduplizierungsansatz, der auf experimentellen und In-silico-MS/MS-Spektraldatenbanken basiert, verbessert die Fähigkeit, Materialstrukturen in molekularen Netzwerken, insbesondere in großen Clustern, zeitnah und bequem zu annotieren.

Am Beispiel von Cluster A in Monobenzylisochinolin-Alkaloiden besteht der Cluster aus 36 Knoten, von denen nur 7 Knoten in der MS-Datenbank, 35 Knoten in der Strukturdatenbank und 8 Knoten sowohl in der MS- als auch in der Strukturdatenbank annotiert sind. Es ist erwähnenswert, dass es einen Knoten bei m/z 344.1855 gibt (tR=7,6329) wurde von der MS-Strukturdatenbank vollständig kommentiert, was darauf hinwies, dass es sich bei der Kandidatenstruktur um 3′-O-Methyl-4′-methoxy-N-methylcoclaurin handelte (wie oben gezeigt).

Durch weitere Analyse hat der Knoten NH verloren3CH3. CH3OH und H2O, gefolgt von Ringfragmentierung, α-Fragmentierung und β-Fragmentierung, wodurch Fragmentionen bei m/z 107,0496, 137,0597, 151,0757, 175,0750, 205,1098, 235,0752, 267,1017, 299,1271 bzw. 312,1590 entstehen.

Identifiziert durch Strukturdatenbank, m/z 448.1963 (tR = 1,6287) ist N-Methylnorcoclaurin-7-O-Glucosid. Ein weiteres m/z 312.1593 (tR = 7,3621) Knoten zeigt vier Kandidatenstrukturen, darunter ein Monobenzylisochinolin. und m/z 344.1855 Knoten (tR=7,6329) im Vergleich zum Knoten bei m/z 190,0862 (C11H12NEIN2) weist darauf hin, dass es sich um eine Methylendioxygruppe handelt.

Forschungsergebnisse: Basierend auf tiefen neuronalen Netzwerken, Vergleich der drei Forschungsalgorithmen aus der Perspektive von t-SNE-Netzwerken

Im Vergleich zu MolNetEnhancer,IMN4NPD verwendet NPClassifier, ein auf tiefen neuronalen Netzwerken basierendes NP-Klassifizierungstool, um jedes Merkmal im molekularen Netzwerk einzeln zu klassifizieren.und nicht ganze Cluster oder Molekülfamilien. In dieser Studie wurde eine verbesserte Kosinus-Ähnlichkeit zur Berechnung der Ähnlichkeitsmatrix verwendet und damit ein t-SNE-Netzwerk generiert. Gleichzeitig klassifizierte diese Studie auch jeden Knoten basierend auf seinen MS/MS-Spektraldaten durch NPClassifier und bildete diese Klassifizierungen im t-SNE-Netzwerk ab.

In der traditionellen molekularen Netzwerkansicht besteht Isochinolin im Allgemeinen aus drei großen Clustern (Cluster AC) und einem kleinen Cluster (Cluster D). Aus der Perspektive des t-SNE-Netzwerks ist es offensichtlich, dass die vier Clusterknoten von Isochinolin eng gruppiert sind, um verschiedene Clusterregionen zu bilden. Es ist jedoch erwähnenswert, dass Cluster A im molekularen Netzwerk aus der Perspektive des t-SNE-Netzwerks weiter in zwei kleinere Cluster unterteilt werden kann. Auch,t-SNE kann Isochinolinknoten effektiv lokalisieren und so den Aufwand für die Strukturanalyse verwandter Knoten erheblich reduzieren.

Vier Clusterregionen von Isochinolin in der t-SNE-Karte

Die modifizierte Kosinus-Ähnlichkeitsmethode weist Einschränkungen auf, wenn es um Spektren von Verbindungen mit verschiedenen chemischen Modifikationen geht. In dieser Studie wurden auch Ähnlichkeitsalgorithmen wie Spec2Vec und MS2DeepScore ausgewählt und zur Generierung eines t-SNE-Netzwerks verwendet. Basierend auf Spec2Vec bildet Isochinolin immer noch vier Hauptcluster im molekularen Netzwerk.

Laut MS2DeepScore liegen die Knoten der großen Cluster A und B von Isochinolin jedoch eng beieinander und bilden mehrere Clusterbereiche, die Knoten im großen Cluster C sind jedoch über das gesamte Diagramm verstreut, was für die nachfolgende Analyse eine Herausforderung darstellt.

Vergleich von t-SNE-Diagrammen, die mit verschiedenen spektralen Ähnlichkeitsalgorithmen erstellt wurden

Ein interessantes Phänomen ist, dass der m/z 296.1646 Knoten (t= 11,54) In den t-SNE-Diagrammen der korrigierten Cosinus-Ähnlichkeit und der MS2DeepScore-Ähnlichkeit liegt er weit entfernt vom Clusterbereich der mit Isochinolin in Zusammenhang stehenden Knoten, aber im t-SNE-Diagramm basierend auf der Spec2Vec-Spektralähnlichkeit liegt der Knoten neben dem Clusterbereich des großen Clusters A. Diese Art von Selbstaustauschknoten kann eine Klasse von Isochinolinverbindungen darstellen, und ein weiterer Vergleich bestätigte, dass der Knoten ein Aporphin-Alkaloid ist.

daher,Die chemische Klassifizierung von Verbindungen und das t-SNE-Netzwerk können jeweils unterschiedliche Informationen über die Merkmale liefern, wodurch das Auftreten falsch-negativer Ergebnisse bis zu einem gewissen Grad reduziert wird.

Darüber hinaus gibt es basierend auf dem t-SNE-Netzwerk der Spec2Vec-Spektralähnlichkeit ein m/z 298,1438 (t= 7,02) und m/z 298,1438 (tR = 7,60) zwei Knoten, nämlich den Selbstaustauschknoten und den Paarknoten im molekularen Netzwerk. Obwohl sie nicht als Isochinolinverbindungen klassifiziert sind, ähneln sie strukturell dem Isochinolincluster A. Weitere Analysen ergaben, dass m/z 298,1438 (tR = 7,02) ist ein bekanntes Aporphinalkaloid, Nornuciferidin, m/z 298,1438 (tR = 7,60) zeigte ebenfalls Aporphinalkaloide ähnlich wie Nuciferin und Nornuciferidin.

Durch die Untersuchung der oben genannten drei Knoten wurde festgestellt, dass sie alle zu Aporphinalkaloiden gehören, die sich von Monobenzylisochinolinalkaloiden unterscheiden. Bei Verwendung der modifizierten Kosinusähnlichkeit und der MS2DeepScore-Ähnlichkeit sind diese drei Knoten weit vom Cluster A entfernt, dem Clusterbereich der Knoten, die mit Monobenzylisochinolin-Alkaloiden in Zusammenhang stehen. Laut Spec2Vec können diese drei Knoten jedoch in der Nähe von Cluster A gefunden werden.

Dieser Unterschied zeigt die überlegene Fähigkeit der spektralen Ähnlichkeit von Spec2Vec, ähnliche Strukturen von Isochinolinverbindungen genau zu erfassen.

Die Anwendung künstlicher Intelligenz in der Naturstoffforschung nimmt zu

Dank der rasanten Entwicklung verschiedener moderner Technologien sind in den letzten Jahren zahlreiche neue Strategien und Methoden auf Basis von LC-MS/MS- und NMR-Technologien in der Erforschung natürlicher bioaktiver Moleküle entstanden, bei denen multidisziplinäre technische Mittel wie Bioinformatik, Metabolomik und Informatik integriert werden. Insbesondere die zunehmende Einbindung künstlicher Intelligenz und maschineller Lernalgorithmen in die Naturstoffforschung hat für Forscher eine neue Runde der Produktivitätsrevolution mit sich gebracht.

Zunächst konzentrierte sich die Anwendung der KI auf die Digitalisierung organischer Moleküle und die Kartierung des chemischen Raums von NP mithilfe von Techniken zur Dimensionsreduzierung. Später entwickelten Forscher binäre Klassifikatoren auf Basis maschinellen Lernens, um die biologischen Funktionen von NPs vorherzusagen. Heute werden neuronale Netzwerkarchitekturen zunehmend für die Genomanalyse und das Moleküldesign eingesetzt, und Deep-Learning-Algorithmen erfreuen sich in den Bereichen Arzneimittelforschung und Molekularinformatik zunehmender Beliebtheit.

Daher können wir feststellen, dass alle Bereiche der Industrie, der Hochschulen und der Forschung das Tempo der entsprechenden Forschung in den letzten Jahren beschleunigt haben. Im Jahr 2022 wird das National Supercomputing Guangzhou Center gemeinsam mit der Sun Yat-sen University, Star Pharmaceutical Technology, dem Massachusetts Institute of Technology und dem Georgia Institute of Technology einen Supercomputer bauen, der auf den leistungsstarken Rechen- und Speicherkapazitäten von Tianhe-2 basiert.Es wird ein Deep-Learning-basiertes Navigationstool für bioretrosynthetische Signalwege, BioNavi-NP, vorgeschlagen.

Auch in der Geschäftswelt nimmt die Forschung zu Naturprodukten Fahrt auf. Im Jahr 2023 schlossen die Tasly Pharmaceutical Group und Huawei Cloud eine Kooperationsvereinbarung. Die beiden Parteien werden die modernen Forschungsdaten zu Naturprodukten usw. kombinieren.Bauen Sie gemeinsam ein vertikales Großmodell im Bereich der Traditionellen Chinesischen Medizin auf.

Allerdings bleiben Naturstoffdatenbanken im wissenschaftlichen Forschungsprozess eine große Herausforderung. Zu den weltweit wichtigsten Naturstoff-Datenspeichern zählen derzeit die Minimum Information of Biosynthetic Gene Clusters (MIBiG), die Natural Products Map (NP Map), das Global Natural Products Molecular Network (GNPS) und die Natural Products Magnetic Resonance Database (NP-MRD) usw. Diese Datenbanken weisen jedoch eine geringe Abdeckung und häufige Datenfehler auf, die den Fortschritt der künstlichen Intelligenz bei der Entdeckung von Naturstoff-Medikamenten behindern.

In den letzten Jahren wurden viele Forscher, darunter der chinesische Wissenschaftler Tu Youyou, der japanische Wissenschaftler Omura Satoshi und der irische Wissenschaftler William C. Campbell, für ihre Leistungen auf dem Gebiet der Totalsynthese von Naturprodukten für den Nobelpreis für Chemie nominiert. Es besteht kein Zweifel daran, dass die Integration künstlicher Intelligenz in die Naturstoffforschung mit der zunehmenden Bedeutung von Naturstoffen beschleunigt wird.