HyperAI

Pour Explorer Pleinement Les Ingrédients Actifs Des Médecines Naturelles, L'équipe Du Professeur Liu Shao De L'université Centrale Du Sud a Construit La Plateforme IMN4NPD

特色图像


En 1806, le pharmacien allemand Sertürner, âgé de 23 ans, isola pour la première fois la morphine monomère du pavot à opium, marquant ainsi le début de la recherche moderne en chimie des médicaments naturels. Sur cette base, le chimiste allemand Friedrich Wǒhler réussit en 1828 la synthèse artificielle de l'urée, qui marqua également la naissance officielle de la discipline de la chimie organique. On peut dire que c’est la recherche continue de l’humanité sur les produits naturels bioactifs (NP) qui a conduit à la création de la discipline de la chimie organique.

Les produits naturels bioactifs (PN) sont en fait des entités matérielles qui ont évolué sur une longue période dans la nature et constituent une source importante pour la recherche et le développement de substances bioactives et de médicaments pratiques. Dans le processus de développement de médicaments, les IP ont apporté de grandes contributions à l’innovation de médicaments thérapeutiques contre le cancer et les maladies infectieuses. Cependant, à ce jour, les NP sont toujours confrontées à des obstacles techniques en matière de criblage, de séparation, de caractérisation et d’optimisation. Parmi eux, la séparation des NP des mélanges complexes est l’un des défis les plus importants, qui est également devenu un goulot d’étranglement majeur dans la recherche sur les médicaments.

Pour remédier à ce goulot d’étranglement,  L'équipe du professeur Liu Shao du département de pharmacie de l'hôpital Xiangya de l'université du centre-sud a mis en place de manière innovante un flux de travail de réseau moléculaire intégré pour la déréplication des NP (IMN4NPD) qui peut explorer de manière exhaustive les composants pharmacologiques des médicaments naturels.Il accélère non seulement la déréplication de clusters étendus dans les réseaux moléculaires, mais fournit également des annotations pour les boucles automatiques et les nœuds appariés qui sont souvent négligés dans les méthodes de recherche existantes. Les résultats de recherche pertinents ont été récemment publiés dans Analytical Chemistry, une revue de l’American Chemical Society (ACS).

Adresse du document :
https://doi.org/10.1021/acs.analchem.3c04746
Suivez le compte officiel et répondez « Médecine Naturelle » pour obtenir le PDF complet

IMN4NPD : intégration de multiples outils informatiques pour piloter des réseaux moléculaires basés sur la similarité spectrale

Le principe de fonctionnement de base d’IMN4NPD est la mise en réseau moléculaire pilotée par la similarité spectrale.Il aide les chercheurs à identifier rapidement des classes spécifiques de composés en intégrant et en coordonnant plusieurs outils de calcul tels que NPClassifier, molDiscovery et les réseaux t-SNE, tout en simplifiant l'annotation des nœuds du réseau moléculaire.
* NPClassifier : Un outil de classification de la structure des produits naturels basé sur des réseaux neuronaux profonds
* molDiscovery : une méthode de recherche dans une base de données de spectrométrie de masse

D'une manière générale, le flux de travail IMN4NPD peut être divisé en 3 étapes :

premier pas,Les données LC-MS brutes ont été prétraitées pour générer des réseaux moléculaires ou des réseaux moléculaires basés sur des caractéristiques. Par la suite, SIRIUS, un outil de classification NP basé sur des réseaux neuronaux profonds, classe systématiquement les classes composites via NPClassifier.

Étape 2 :Cette étude a mené des expériences de déréplication basées sur des bases de données spectrales MS/MS via GNPS (Global Natural Product Social Molecular Networking), puis a effectué une déréplication basée sur une base de données informatique via molDiscovery.

Étape 3.Les chercheurs ont utilisé la similarité des caractéristiques spectrales MS/MS pour générer un réseau t-SNE et ont classé chimiquement les composés à chaque nœud pour localiser et reproduire avec précision des classes de composés spécifiques distribuées dans le réseau auto-circulant.

Diagramme de flux de travail IMN4NPD

Évaluation de l'utilisabilité : exploration des analogues de l'isoquinoléine pour identifier rapidement des groupes de composés spécifiques dans les réseaux moléculaires

Pour évaluer les performances et les avantages du flux de travail IMN4NPD, l’extrait d’éthanol du noyau de graines de lotus a été réanalysé dans cette étude. Le noyau de la graine de lotus est la partie embryonnaire de la gousse de lotus. C'est une plante médicinale traditionnelle chinoise riche en divers alcaloïdes tels que la dibenzylisoquinoléine, la monobenzylisoquinoléine et l'aporphine. Il peut être utilisé pour traiter l’insomnie, la spermatorrhée, les troubles du rythme cardiaque, l’hypertension et d’autres symptômes.

Sur la base d'une base de données spectrales MS/MS expérimentale, cette étude a d'abord classé chimiquement les nœuds individuels du réseau moléculaire, identifiant ainsi rapidement des groupes de composés spécifiques dans le réseau moléculaire pour explorer de nouveaux analogues d'isoquinoléine. Après avoir examiné les résultats de la classification chimique de chaque cartographie des caractéristiques du réseau moléculaire, les chercheurs ont constaté qu’il était facile de trouver certains groupes de composés correspondant aux analogues de l’isoquinoléine. Dans le même temps, les composés isoquinoléines étaient principalement répartis en quatre groupes dans le réseau moléculaire.

Carte de distribution des composés isoquinoléines

L’étude a également révélé que seul un nombre limité de caractéristiques dans de grands amas pouvaient être reproduites avec succès à l’aide de bases de données spectrales MS/MS expérimentales telles que la base de données GNPS. donc,Cette étude a utilisé l’algorithme de fragment in silico de pointe molDiscovery pour la correspondance de bases de données structurelles.Cette approche de déduplication basée sur des bases de données spectrales MS/MS expérimentales et in silico améliore la capacité à annoter les structures matérielles dans les réseaux moléculaires, en particulier dans les grands clusters, de manière rapide et pratique.

Prenons comme exemple le cluster A des alcaloïdes monobenzylisoquinoléines. Le cluster est composé de 36 nœuds, dont seulement 7 nœuds sont annotés dans la base de données MS, 35 nœuds sont annotés dans la base de données Structure et 8 nœuds sont annotés par les bases de données MS et Structure. Il convient de noter qu'il existe un nœud à m/z 344,1855 (tR=7,6329) a été entièrement annoté par la base de données de structure MS, qui a indiqué que la structure candidate était la 3′-O-méthyl-4′-méthoxy-N-méthylcoclaurine (comme indiqué ci-dessus).

Après une analyse plus approfondie, le nœud a perdu NH3CH3. CH3OH et H2O, suivi d'une fragmentation en anneau, d'une fragmentation α et d'une fragmentation β, produisant des ions fragments à m/z 107,0496, 137,0597, 151,0757, 175,0750, 205,1098, 235,0752, 267,1017, 299,1271 et 312,1590, respectivement.

Identifié par la base de données Structure, m/z 448.1963 (tR = 1,6287) est le N-méthylnorcoclaurine 7-O-glucoside. Un autre m/z 312.1593 (tR = 7.3621) Le nœud montre quatre structures candidates, dont 1 monobenzylisoquinoléine. et nœud m/z 344,1855 (tR=7,6329) par rapport au nœud à m/z 190,0862 (C11H12NON2) indique qu'il s'agit d'un groupe méthylènedioxy.

Résultats de recherche : Basés sur des réseaux neuronaux profonds, comparaison des trois algorithmes de recherche du point de vue des réseaux t-SNE

Comparé à MolNetEnhancer,IMN4NPD utilise NPClassifier, un outil de classification NP basé sur un réseau neuronal profond, pour classer individuellement chaque caractéristique du réseau moléculaire.plutôt que des groupes entiers ou des familles de molécules. Cette étude a utilisé une similarité cosinus améliorée pour calculer la matrice de similarité et l'a utilisée pour générer un réseau t-SNE. Dans le même temps, cette étude a également classé chaque nœud en fonction de ses données spectrales MS/MS via NPClassifier et a mappé ces classifications dans le réseau t-SNE.

Dans la vision traditionnelle du réseau moléculaire, l'isoquinoléine est généralement composée de trois grands clusters (clusters AC) et d'un petit cluster (cluster D). Du point de vue du réseau t-SNE, il est évident que les quatre nœuds de cluster d'isoquinoléine sont étroitement regroupés pour former différentes régions de cluster. Mais il convient de noter que du point de vue du réseau t-SNE, le cluster A du réseau moléculaire peut être divisé en deux clusters plus petits. aussi,Le t-SNE peut localiser efficacement les nœuds isoquinoléines, réduisant ainsi considérablement le travail d'analyse structurelle des nœuds associés.

Quatre régions de regroupement d'isoquinoléine dans la carte t-SNE

La méthode de similarité cosinus modifiée présente des limites lorsqu'il s'agit de traiter des spectres de composés présentant diverses modifications chimiques. Cette étude a également sélectionné des algorithmes de similarité tels que Spec2Vec et MS2DeepScore et les a utilisés pour générer un réseau t-SNE. D'après Spec2Vec, l'isoquinoléine forme toujours quatre groupes majeurs dans le réseau moléculaire.

Cependant, d'après MS2DeepScore, les nœuds des grands groupes A et B d'isoquinoléine sont étroitement espacés, formant plusieurs régions de regroupement, mais les nœuds du grand groupe C sont dispersés sur tout le graphique, ce qui pose un défi pour l'analyse ultérieure.

Comparaison des graphiques t-SNE générés par divers algorithmes de similarité spectrale

Un phénomène intéressant est que le nœud m/z 296.1646 (t= 11,54) Dans les diagrammes t-SNE de similarité cosinus corrigée et de similarité MS2DeepScore, il est loin de la zone de regroupement des nœuds liés à l'isoquinoléine, mais dans le diagramme t-SNE basé sur la similarité spectrale Spec2Vec, le nœud est adjacent à la zone de regroupement du grand cluster A. Ce type de nœud d'auto-échange peut représenter une classe de composés d'isoquinoléine, et une comparaison plus poussée a confirmé que le nœud est un alcaloïde aporphine.

donc,La classification chimique des composés et le réseau t-SNE peuvent fournir des informations différentes sur les caractéristiques, respectivement, ce qui réduit dans une certaine mesure l'apparition de faux négatifs.

De plus, sur la base du réseau t-SNE de similarité spectrale Spec2Vec, il existe un m/z de 298,1438 (t= 7,02) et m/z 298,1438 (tR = 7,60) deux nœuds, qui sont le nœud d'auto-échange et le nœud de paire dans le réseau moléculaire. Bien qu'ils ne soient pas classés comme composés d'isoquinoléine, ils sont structurellement similaires au groupe d'isoquinoléine A. Une analyse plus approfondie a révélé que m/z 298,1438 (tR = 7,02) est un alcaloïde aporphine connu, la nornuciféridine, m/z 298,1438 (tR = 7,60) ont également montré des alcaloïdes aporphines similaires à la nuciférine et à la nornuciféridine.

Grâce à l’étude des trois nœuds ci-dessus, il a été découvert qu’ils appartiennent tous aux alcaloïdes aporphines, qui sont différents des alcaloïdes monobenzylisoquinoléines. Lors de l'utilisation de la similarité cosinus modifiée et de la similarité MS2DeepScore, ces trois nœuds sont éloignés du cluster A, la zone de regroupement des nœuds liés aux alcaloïdes monobenzylisoquinoléines, mais sur la base de Spec2Vec, ces trois nœuds peuvent être trouvés à proximité du cluster A.

Cette différence démontre la capacité supérieure de la similarité spectrale Spec2Vec à capturer avec précision des structures similaires de composés isoquinoléines.

L’application de l’intelligence artificielle dans la recherche sur les produits naturels s’accélère

Ces dernières années, bénéficiant du développement rapide de diverses technologies modernes, un grand nombre de nouvelles stratégies et méthodes basées sur les technologies LC-MS/MS et RMN ont émergé dans la recherche de molécules bioactives naturelles, intégrant des moyens techniques multidisciplinaires tels que la bioinformatique, la métabolomique et l'informatique. En particulier, à mesure que l’intelligence artificielle et les algorithmes d’apprentissage automatique commencent à être intégrés dans la recherche sur les produits naturels, ils ont apporté une nouvelle révolution de la productivité aux chercheurs.

Initialement, l’application de l’IA s’est concentrée sur la numérisation des molécules organiques et la cartographie de l’espace chimique des NP à l’aide de techniques de réduction de dimensionnalité. Plus tard, les chercheurs ont développé des classificateurs binaires d’apprentissage automatique pour prédire les fonctions biologiques des NP. Aujourd’hui, les architectures de réseaux neuronaux commencent à être utilisées pour l’exploration du génome et la conception moléculaire, et les algorithmes d’apprentissage profond deviennent de plus en plus populaires dans les domaines de la découverte de médicaments et de l’informatique moléculaire.

Nous pouvons donc constater que tous les secteurs de l’industrie, du monde universitaire et de la recherche ont accéléré le rythme de la recherche dans ce domaine ces dernières années. En 2022, le Centre national de supercalcul de Guangzhou s'associera à l'Université Sun Yat-sen, à Star Pharmaceutical Technology, au Massachusetts Institute of Technology et au Georgia Institute of Technology pour construire un supercalculateur basé sur les puissantes capacités de calcul et de stockage de Tianhe-2.Un outil de navigation de voie biorétrosynthétique basé sur l'apprentissage profond, BioNavi-NP, est proposé.

Dans le monde des affaires, la recherche sur les produits naturels s’accélère également. En 2023, Tasly Pharmaceutical Group et Huawei Cloud ont conclu un accord de coopération. Les deux parties combineront les données de recherche modernes sur les produits naturels, etc.Co-construire un grand modèle vertical dans le domaine de la médecine traditionnelle chinoise.

Cependant, les bases de données sur les produits naturels restent un défi majeur dans le processus de recherche scientifique. Actuellement, les principaux référentiels de données sur les produits naturels du monde comprennent les informations minimales sur les groupes de gènes biosynthétiques (MIBiG), la carte des produits naturels (NP Map), le réseau moléculaire mondial des produits naturels (GNPS), la base de données de résonance magnétique des produits naturels (NP-MRD), etc. Cependant, ces bases de données ont une faible couverture et des problèmes d'erreur de données courants, qui ont entravé les progrès de l'intelligence artificielle dans la découverte de médicaments à base de produits naturels.

Ces dernières années, de nombreux chercheurs, dont le scientifique chinois Tu Youyou, le scientifique japonais Omura Satoshi et le scientifique irlandais William C. Campbell, ont été nominés pour le prix Nobel de chimie pour leurs réalisations dans la synthèse totale de produits naturels. Il ne fait aucun doute qu’à mesure que l’importance des produits naturels continue d’émerger, l’intégration de l’intelligence artificielle dans la recherche sur les produits naturels est sur le point de s’accélérer.