Le Groupe De Recherche De Li Honglin À L'université Des Sciences Et Technologies De Chine Orientale Développe Macformer Pour Accélérer La Découverte De Médicaments Macrocycliques

Les composés macrocycliques sont de petites molécules ou peptides composés de plus de 12 atomes. Comparés à d’autres composés à petites molécules, les composés macrocycliques présentent de nombreux avantages en termes de structure et de performances et sont donc considérés comme des médicaments thérapeutiques potentiels pour diverses cibles.
Les analogues macrocycliques basés sur la synthèse de la chimie médicinale sont une source majeure de médicaments macrocycliques. Cependant, en raison du manque de méthodes de synthèse, de la grande difficulté de synthèse et du peu de matériaux de référence, le développement de médicaments macrocycliques a reçu peu d’attention.
À cette fin, le groupe de recherche de Li Honglin à l'Université des sciences et technologies de Chine orientale a développé Macformer basé sur Transformer. Macformer a macrocyclisé avec succès le médicament acyclique feizotinib pour obtenir de nouveaux composés avec une efficacité plus forte, offrant une nouvelle approche pour le développement de médicaments.
Auteur | Xuecai
Rédacteur | Sanyang
L'histoire des médicaments macrocycliques
Les macrocycles sont de petites molécules ou peptides composés de plus de 12 atomes.. Ce type de composé a un poids moléculaire élevé et un grand nombre de donneurs de liaisons hydrogène, et possède une affinité, une sélectivité et des propriétés pharmacologiques plus fortes.Les médicaments macrocycliques ont été considérés comme des médicaments thérapeutiques potentiels pour diverses cibles, tels que les kinases, les protéases et les récepteurs couplés aux protéines G.

Outre les médicaments macrocycliques naturels, les analogues basés sur la synthèse chimique pharmaceutique constituent également une source majeure de médicaments macrocycliques.En macrocyclisant des médicaments acycliques connus, de nouveaux médicaments macrocycliques peuvent être obtenus directement et efficacement., et obtenir les propriétés pharmacologiques souhaitées. Cependant,En raison du manque de méthodes de synthèse et de la grande difficulté de synthèse, les médicaments macrocycliques reçoivent encore peu d’attention dans la conception des médicaments.
Actuellement, la macrocyclisation des molécules linéaires repose principalement sur l’inférence empirique. De plus, même si la littérature présente les résultats finaux de la synthèse, le processus de synthèse et d’inférence du médicament est toujours vague. Le processus de synthèse opaque et non standard a élevé le seuil de l'industrie et entravé le développement de médicaments macrocycliques.
Bien que l’apprentissage profond ait montré un grand potentiel à différentes étapes du développement de médicaments,Mais la formation des réseaux neuronaux nécessite beaucoup de données. Étant donné qu’il existe moins de 90 médicaments macrocycliques cliniquement approuvés, il n’existe aucune recherche sur la macrocyclisation des médicaments à l’aide d’algorithmes d’apprentissage profond.
à cette fin,Le groupe de recherche de Li Honglin à l'Université des sciences et technologies de Chine orientale a développé Macformer basé sur Transformer, pour réaliser la macrocyclisation de molécules linéaires. Ils ont élargi les données en représentant le même composé à l’aide de différentes spécifications d’entrée linéaire moléculaire simplifiées (SMILES).
Par la suite, en prenant comme exemple le Fedratinib, un inhibiteur de JAK2 approuvé par la Food and Drug Administration (FDA) américaine, Macformer a été utilisé pour le macrocycliser afin d'obtenir un nouveau composé macrocyclique.Ce composé présente une meilleure sélectivité et de meilleures propriétés pharmacocinétiques, de sorte que la dose requise est inférieure à celle du fuzotinib. Ce résultat a été publié dans « Nature Communication ».

Obtenez le papier :https://www.nature.com/articles/s41467-023-40219-8
Suivez le compte officiel et répondez « médicaments macrocycliques » pour obtenir le document complet en PDF.
Procédures expérimentales
Ensemble de données:Augmentation des données de l'ensemble de données ChEMBL
Dans un premier temps, les chercheurs ont collecté 18 357 composés macrocycliques biologiquement actifs à partir de la base de données ChEMBL et les ont examinés. Ensuite, deux liaisons chimiques quelconques du composé macrocyclique sont traversées et ses lieurs sont séparés pour trouver le composé acyclique correspondant.Finalement, un total de 237 728 paires de composés macrocycliques-acycliques ont été obtenues comme ensemble de données pour cette étude..

Chaque composé a une expression SMILES spécifique. Cependant, des études récentes ont montré queEntraînement de modèle utilisant un ensemble d'expressions SMILES aléatoires chimiquement identiques mais syntaxiquement différentes, ce qui peut améliorer considérablement les performances des modèles d’apprentissage en profondeur. Les chercheurs ont comparé les données étendues de 2, 5 et 10 fois avec les données originales, et toutes les données ont montré une bonne convergence après 50 000 étapes.

Architecture du modèle:Codage et décodage du transformateur
Macformer est basé sur l'architecture Transformer. Les séquences SMILES des composés d'entrée et cibles sont intégrées dans une matrice entraînable et codées positionnellement à l'aide de fonctions sinus et cosinus.
La matrice d'intégration du composé d'entrée est introduite dans l'encodeur pour générer une représentation latente afin d'initialiser le processus d'encodage. Chaque couche d'encodeur se compose d'une couche d'attention multi-têtes et d'un réseau d'anticipation de position.
L'objectif ultime de Macformer est de minimiser l'écart entre la séquence prédite et la séquence cible correspondante via la fonction de perte d'entropie croisée et de produire le composé macrocyclique prédit..

Étude comparative:Ensembles de données ChEMBL
Les chercheurs ont comparé Macformer avec un modèle d’apprentissage non profond, MacLS. Après avoir entré un composé acyclique, les deux peuvent produire un analogue macrocyclique. donc,La validité chimique, la nouveauté et l'unicité des macrocycles seront utilisées comme critères d'évaluation des performances du modèle..
Par rapport à l'ensemble de données d'origine, l'expansion de 2 fois de l'ensemble de données a amélioré les performances globales du modèle, en particulier en termes de taux de récupération (96,09% contre 54,85%), d'efficacité (80,34% contre 66,74%) et de nouveauté du connecteur (58,91% contre 40,56%), tandis qu'une nouvelle expansion de l'ensemble de données n'a pas continué à améliorer les performances du modèle.

MacLS_self génère des conformations de novo en utilisant des SMILES acycliques, tandis que MacLS_extra extrait des conformations à partir de structures 3D à faible énergie de macrocycles cibles.
L'efficacité de MacLS_self n'est que de 17,05%, tandis que la nouveauté et l'unicité du composé de MacLS_extra surpassent celles de Macformer. Cependant, MacLS ne peut rechercher que des connectons à partir de l'ensemble d'entraînement, donc la nouveauté des connectons est de 0. De plus, le taux de récupération des composés macrocycliques par MacLS est également très faible, inférieur à 5%.
Étude comparative:Ensemble de données ZINC
De plus, les deux modèles sont comparés sur l'ensemble de données externe ZINC. Le modèle Macformer formé avec un ensemble de données étendu 5 fois a un taux de récupération de plus de 80%, une efficacité de plus de 84% et une nouveauté de plus de 99%.Les résultats ci-dessus montrent que Macformer a une excellente capacité de généralisation après l’expansion des données.

Étant donné que MacLS n’a pas la capacité d’apprentissage de Macformer, ses résultats sur différents ensembles de données sont fondamentalement similaires.
Distribution chimique:Macformer ressemble plus à une entrée
Quelle que soit la nouveauté du linker, Macformer et MacLS ont tous deux la capacité de générer de nouveaux macrocycles. Les chercheurs ont donc comparé la distribution des composés générés par les deux dans l’espace chimique.
Dans un premier temps, les similitudes entre les composés ont été comparées à l’aide du coefficient de Tanimoto. En raison des similitudes structurelles entre les composés acycliques et les composés macrocycliques, les coefficients de Tanimoto de la plupart des composés générés par le modèle sont supérieurs à 0,7. Cependant, la similarité structurelle des composés générés par Macformer avec les composés originaux était supérieure à celle de MacLS_extra.

Ce résultat est quelque peu inhabituel car Macformer est capable de déduire des connexions qui ne sont pas présentes dans l’ensemble d’entraînement, alors que MacLS n’a pas cette capacité. À cette fin, les chercheurs ont utilisé l’algorithme d’approximation et de projection de collecteur unifié (UMAP) pour réduire la dimensionnalité des données. Les résultats montrent queLes nouveaux linkers générés par Macformer sont distribués à proximité de l'ensemble d'entraînement ChEMBL..
Vérification expérimentale
Développement de médicaments:Macrocyclisation du fuzotinib
Ces dernières années, les composés macrocycliques ont attiré beaucoup d’attention en tant qu’inhibiteurs potentiels de kinases. Pour vérifier les performances prédictives du modèle, les chercheurs ont utilisé Macformer pour concevoir des inhibiteurs de JAK2. JAK2 appartient à la famille des kinases JAK et constitue une cible importante pour le traitement des néoplasmes myéloprolifératifs et de la polyarthrite rhumatoïde.
L’entrée du modèle était le fuzotinib, un médicament à petite molécule utilisé pour traiter la myélofibrose. Le filtratinib présente une meilleure sélectivité pour JAK2 que les autres kinases JAK, mais une faible sélectivité pour d’autres kinases, ce qui entraîne d’autres effets secondaires.
Les points d'attache pour la macrocyclisation ont été fixés sur les deux cycles phényles terminaux, et le tert-butyl xanthamide qui pourrait être préjudiciable au contact avec le site cible Asp994 a été retiré. Pour augmenter la diversité des médicaments macrocycliques prédits, chaque séquence source SMILES a été étendue 10 fois.Au final, Macformer a produit 10 700 résultats, dont 281 nouveaux médicaments macrocycliques.

Après avoir évalué la liaison des médicaments macrocycliques aux cibles et la faisabilité de la synthèse, les chercheurs ont finalement sélectionné trois composés pour des tests d’évaluation synthétique.Parmi eux, le lieur du composé 1 n’a pas été signalé dans la conception de médicaments macrocycliques ou dans le développement d’inhibiteurs de JAK2..
Parmi les 300 médicaments macrocycliques conçus par MacLS,Ces 3 composés n'ont pas été trouvés, ce qui prouve une fois de plus le potentiel des algorithmes d’apprentissage profond dans la conception de nouveaux médicaments.
Évaluation in vitro:Activité aux niveaux enzymatique et cellulaire
Par la suite, les activités de ces trois composés contre JAK2 ont été évaluées.Les concentrations inhibitrices à moitié (CI50) étaient respectivement de 0,07, 0,364 et 0,006 μM. . Les composés les plus puissants 1 et 3 ont été évalués pour la spécificité à 100 μM, et seulement 10 et 17 kinases de type sauvage ont été inhibées, respectivement, tandis que 34 kinases de type sauvage ont été affectées par le ferritinib, indiquant que les composés 1 et 3 étaient plus sélectifs.

Parallèlement, les propriétés antiprolifératives des composés 1 à 3 contre les cellules dépendantes de JAK2 ont également été évaluées. Les résultats montrent queLes composés 1 et 3 peuvent inhiber la prolifération des cellules dépendantes de JAK2 à une dose plus faible que le fuzotinib.
Évaluation in vivo:Tests pharmacocinétiques
Enfin, la pharmacocinétique (PK) des composés 1, 3 et du fuzetinib a été étudiée après administration intraveineuse (iv, 5 mg/kg) et orale (po, 5 mg/kg).
Le composé 3 était supérieur au fuzotinib dans tous les aspects, sauf la biodisponibilité (9,4% contre 11,7%). Dans le même temps, le composé 1 présente également des avantages en termes de propriétés orales, telles que l'exposition systémique (106,00 contre 50,19 h*ng/mL) et la biodisponibilité (14,1% contre 11,7%). Les résultats ci-dessus montrent queLa macrocyclisation est bénéfique pour améliorer la stabilité métabolique des médicaments de type fuzotinib.

Tests in vivo:Le composé 3 inhibe l'inflammation
Il a été rapporté que la surexpression de JAK2 peut conduire à une maladie inflammatoire chronique de l’intestin (MICI), ce qui signifie que l’inhibition de l’activité de JAK2 peut être utile dans le traitement de la MICI.Les chercheurs ont testé des médicaments macrocycliques sur des modèles murins pour évaluer leur rôle dans le traitement des MII.
Selon les résultats des tests pharmacocinétiques, la dose de feizotinib était deux fois supérieure à celle du composé 3. Les résultats ont montré que le composé 3 et le fuzetinib ont tous deux atténué la perte de poids causée par l'IDB, et l'indice d'activité de la maladie du groupe expérimental a été significativement réduit à partir du 8e jour.
Enfin, la coloration HE a été utilisée pour analyser la gravité de l’inflammation. Le groupe témoin a montré une réponse inflammatoire significative, y compris une infiltration de cellules inflammatoires et une perte de cellules caliciformes, tandis que la réponse inflammatoire dans l'expérience était plus légère et la structure du côlon était intacte.

Les résultats ci-dessus montrent que les composés macrocycliques déduits par Macformer sont supérieurs aux médicaments traditionnels en termes de pharmacocinétique et de sélectivité, et peuvent permettre de traiter la maladie avec des doses plus faibles.
Haute efficacité, synthèse difficile, la joie et la tristesse des cycles macrocycliques
À partir de 2020,La Food and Drug Administration (FDA) des États-Unis a approuvé 67 médicaments macrocycliques, soit 41 % de tous les médicaments approuvés. . Parmi eux, 59 sont des médicaments macrocycliques naturels et seulement 8 sont non naturels. En 2008, la FDA a approuvé le premier médicament macrocyclique non naturel, le Plerixafor, pour le traitement du cancer.
Les principales indications des médicaments macrocycliques sont les maladies infectieuses, représentant 44,4%, suivies des tumeurs (20,8%) et des antifongiques (8,3%). Ces dernières années, l’utilisation de médicaments macrocycliques dans le domaine antitumoral a augmenté de façon spectaculaire. Il n’y en avait que quatre avant 2007, tandis que 11 ont été approuvés depuis.

Les médicaments macrocycliques peuvent fournir diverses fonctions et structures chimiques complexes dans une structure semi-rigide et pré-organisée, ce qui peut augmenter l'affinité et la sélectivité des médicaments macrocycliques pour des cibles difficiles à lier aux petites molécules traditionnelles, améliorant ainsi l'efficacité du médicament. De plus, certains médicaments macrocycliques sont capables d’ajuster leur conformation pour s’adapter à l’environnement extérieur. Cette capacité augmente sa solubilité dans l’eau et sa perméabilité cellulaire.
Cependant,La synthèse des médicaments macrocycliques est très compliquée. Bien que la structure macrocyclique améliore la capacité à se lier à des cibles spécifiques, elle conduit également à une contrainte d'anneau, à des interactions spatiales et à des interactions inter-anneaux non covalentes.Cela rend plus difficile la prédiction de la structure et des propriétés moléculaires..
L’IA est de plus en plus utilisée dans le développement de médicaments. Cependant, les données limitées limitent souvent les performances de l’IA. Dans cette étude,Les chercheurs ont effectué une augmentation des données à l’aide d’expressions SMILES aléatoiresTout en garantissant la richesse de l'ensemble de données, les performances de prédiction de Macformer sont améliorées.
À l’avenir, à mesure que la compréhension de la structure et des propriétés des médicaments s’approfondira, l’IA jouera un rôle plus important dans le développement de nouveaux médicaments, préservant ainsi la santé des personnes.
Liens de référence :
[1]https://www.cambridgemedchemconsulting.com/resources/hit_identification/macrocycles/macrocycles.html
[2]https://pubs.acs.org/doi/10.1021/acs.jmedchem.3c00134