HyperAI

Le Dernier Ouvrage De David Baker ! La Conception De Novo D'un Cadre De Liaison Peptidique Macrocyclique RFpeptides Offre De Nouvelles Possibilités Pour Les Protéines Non Médicamenteuses

特色图像

Dans la longue lutte de l’humanité contre la maladie, la recherche et le développement de médicaments ont toujours été à l’avant-garde de l’exploration scientifique. Parmi eux, les médicaments à petites molécules sont devenus la principale force dans la recherche et le développement de médicaments en raison de leurs avantages tels qu'une préparation facile, une forte perméabilité cellulaire, une administration orale pratique et un faible coût de fabrication. Cependant, les médicaments à petites molécules sont souvent impuissants contre les protéines dépourvues de poches hydrophobes profondes. Avec les progrès de la science, les macrocycles, avec leur structure tridimensionnelle unique et leur haute affinité, peuvent réguler des cibles moléculaires difficiles à atteindre avec les médicaments traditionnels à petites molécules, offrant de nouvelles possibilités thérapeutiques pour ces protéines « non médicamenteuses ».

Cependant, le développement traditionnel de médicaments repose sur la découverte de produits naturels ou sur une technologie de criblage à haut débit, ce qui prend du temps et coûte cher. Le développement de l’IA a apporté de nouvelles avancées dans la conception de médicaments. Récemment,L'équipe de David Baker, un biologiste computationnel exceptionnel et directeur du Washington Institute for Protein Research, qui a remporté le prix Nobel de chimie 2024, a développé une technologie innovante basée sur un modèle de diffusion, RFpeptides, pour concevoir des liants peptidiques macrocycliques à haute affinité pour une variété de cibles protéiques.

Plus précisément, la technologie utilise RoseTTAFold modifié et RFdiffusion avec codage de position relative en boucle pour générer des squelettes macrocycliques précis, intègre ProteinMPNN et Rosetta Relax pour l'optimisation des séquences et peut réaliser une conception macrocyclique ciblée et efficace, ouvrant de nouvelles possibilités pour le développement de médicaments et la technologie de diagnostic. L'étude, intitulée « Conception précise de novo de macrocycles de liaison aux protéines à haute affinité à l'aide de l'apprentissage profond », a été publiée sous forme de pré-impression sur bioRxiv.

Points saillants de la recherche :

* RFpeptides excelle dans la conception de macrocycles avec différentes structures secondaires, y compris des conformations en hélice α, en feuillet β et en boucle, qui peuvent être adaptées à des interfaces protéiques spécifiques, faisant progresser les applications thérapeutiques et diagnostiques

* Les macrocycles conçus par RFpeptides ciblant MCL1, MDM2, GABARAP et RbtA ont tous montré une affinité de liaison élevée

* Les RFpeptides peuvent concevoir des liants de novo pour des protéines avec des structures non résolues, changeant les règles de conception de cibles pour des protéines sous-explorées ou non caractérisées


Adresse du document :
https://doi.org/10.1101/2024.11.18.622547

Suivez le compte officiel et répondez « 大环设计 » pour obtenir le PDF complet

Le projet open source « awesome-ai4s » rassemble plus de 100 interprétations d'articles AI4S et fournit des ensembles de données et des outils massifs :

https://github.com/hyperai/awesome-ai4s

Ensemble de données : ciblage de MCL1, MDM2, GABARAP et RbtA, sélection de protéines cibles pour la conception de macrocycles

Dans l’étude de conception de novo des liants macrocycliques, l’équipe de recherche a choisi MCL1, qui joue un rôle clé dans le traitement anticancéreux, comme première protéine cible.En utilisant la technologie RFpeptides, le chercheur a généré 9 965 squelettes peptidiques cycliques divers et a conçu 4 séquences d'acides aminés pour chaque squelette en utilisant les processus de conception ProteinMPNN et Rosetta Relax. Après un examen basé sur l’apprentissage profond et des indicateurs physiques, 27 conceptions ont finalement été sélectionnées pour une caractérisation expérimentale.

L’étude a également ciblé MDM2, qui interagit avec la protéine suppressive de tumeur p53.Dix mille squelettes macrocycliques ont été générés et quatre séquences d’acides aminés ont été conçues pour chaque squelette. Parmi les 40 000 conceptions prédites par AfCycDesign, 7 495 ont été considérées comme se liant efficacement à MDM2.

Lors de la conception de composés macrocycliques de GABARAP,L'équipe de recherche a défini six résidus de points chauds, généré 20 000 squelettes macrocycliques et conçu des séquences d'acides aminés. Parmi 80 000 modèles, 335 modèles macrocycliques ont été sélectionnés pour étude.

Pour RbtA,L'équipe de recherche a utilisé AF2 et RF2 pour prédire sa structure, défini 7 résidus de points chauds, généré 20 000 chaînes principales et conçu 4 séquences d'acides aminés pour chaque chaîne principale. Dans ce processus, ProteinMPNN itératif et Rosetta Relax ont été utilisés dans le processus de conception.

RFpeptides : un pipeline d'apprentissage profond génératif pour la conception de novo de macrocycles ciblant les protéines cibles

Les RFpeptides permettent une conception ciblée et efficace de macrocycles. Plus précisément, il utilise RoseTTAFold modifié et RFdiffusion avec codage de position relative en boucle pour générer des squelettes de macrocycle précis, intégrant ProteinMPNN et Rosetta Relax pour l'optimisation de la séquence.

Processus de conception des RFpeptides

RFpeptides : une nouvelle extension de RoseTTAFold2 et RFdiffusion

L’étude a d’abord évalué la capacité de modélisation du réseau de prédiction de structure RoseTTAFold2 (RF2) pour les structures peptidiques cycliques connues. Comme le montre la figure A ci-dessous, les chercheurs ont apporté des améliorations clés au RF2 en introduisant un mécanisme de codage de position relative cyclique et ont observé qu'il permettait des prédictions robustes des structures peptidiques cycliques naturelles.

Principales améliorations apportées au réseau de prédiction de structure RF2

Compte tenu de ce succès, les chercheurs ont estimé que le codage de position relative cyclique pourrait également permettre à RFdiffusion de générer des structures peptidiques macrocycliques grâce à une architecture de réseau similaire. Par conséquent, comme le montre la figure BC ci-dessus, cette étude a ajouté le codage de position relative de boucle à la diffusion RF et a observé avec succès la génération robuste de peptides macrocycliques diversifiés.

Inspirée par la transférabilité du codage positionnel relatif des boucles, l'équipe de recherche a commencé à utiliser la diffusion RF pour la conception de novo de macroboucles de liaison aux protéines. Comme le montre la figure D ci-dessous, cette étude a utilisé le codage de position relative circulaire dans le processus de conception de protéines RFdiffusion pour fournir le codage des chaînes générées. Ensuite, comme le montre la figure E ci-dessous, ProteinMPNN a été utilisé pour concevoir des séquences d’acides aminés correspondant au squelette macrocyclique pour compléter la construction des RFpeptides. Comme le montre la figure F ci-dessous, Les RFpeptides peuvent générer rapidement des composés macrocycliques avec diverses structures secondaires contre des protéines cibles.

Procédé RFpeptides pour la conception de macrocycles de liaison aux protéines

Composés macrocycliques : criblage raffiné basé sur la conception de produits RFpeptides

Après avoir utilisé des RFpeptides pour générer divers squelettes de composés macrocycliques pour différentes cibles, l'étude a continué à utiliser ProteinMPNN et Rosetta Relax pour apporter des modifications locales aux chaînes principales générées afin d'obtenir une diversité dans les séquences d'acides aminés.

Tout d'abord, sur la base de l'iPAE, de l'évaluation de la similarité des modèles et du criblage assisté par RF2, les chercheurs ont utilisé AfCycDesign pour prédire à nouveau les complexes protéines-macrocycles conçus à l'aide de séquences de macrocycles et de structures cibles comme modèles, et ont sélectionné des conceptions avec une grande confiance.

Deuxièmement, l'étude a utilisé Rosetta pour calculer des indicateurs de qualité tels que l'affinité de liaison (ddG), la tendance à l'agrégation spatiale des macrocycles conçus (SAP) et la surface moléculaire de contact d'interface (CMS) pour affiner le criblage des candidats.

Finalement, les chercheurs ont sélectionné une poignée de modèles sélectionnés, déterminé leurs affinités de liaison dans des expériences par synthèse chimique et caractérisation biochimique, et les ont vérifiés par des tests comparatifs pour garantir l'exactitude et l'efficacité des modèles.

Une précision quasi parfaite valide le pouvoir de prédiction de liaison des RFpeptides

Conception et caractérisation de composés macrocycliques ciblant MCL1 et MDM2

Pour vérifier l’efficacité des RFpeptides, les chercheurs ont d’abord sélectionné la protéine 1 de la leucémie myéloïde (MCL1) comme première protéine cible et ont procédé à une caractérisation expérimentale. Comme le montre la figure AB ci-dessous,Les chercheurs ont découvert que MCB_D2 (violet) se liait le plus étroitement à MCL1 (surface grise), présentant une affinité de liaison de 2 μM.

Pour confirmer si le macrocycle s'est lié de la manière prévue, les chercheurs ont déterminé la structure cristalline aux rayons X de MCB_D2 lié à MCL1. Comme le montre la figure C ci-dessous,La structure cristalline est presque identique au modèle conçu.La valeur RMSD de Cα est de 0,7 Å. Comme le montre la figure D ci-dessous, lorsque le macrocycle est superposé à la structure cristalline, le RMSD Cα est de 0,4 Å et les conformations de la chaîne latérale des résidus en interaction dans la structure cristalline sont également très proches du modèle conçu. Dans une analyse plus approfondie de la structure cristalline, les figures E et F ont également révélé que la région de boucle de MCB_D2 avait des contacts hydrophobes et des interactions cation-π avec MCL1.

Conception et caractérisation de novo des liants macrocycliques de MCL1

Inspirée par la vérification expérimentale de la liaison de MCL1 à des molécules circulaires, l’équipe de recherche s’est ensuite attachée à concevoir des liants pour MDM2. Comme le montre la figure GI suivante,Les chercheurs ont découvert que MDB_D8 était le meilleur composé macrocyclique pour MDM2, montrant une affinité élevée de 1,9 μM.De plus, les points de contact clés à l'interface prédits par la modélisation informatique partagent des similitudes avec les interactions observées dans la structure native du complexe MDM2-p53.

Conception et caractérisation de novo de liants macrocycliques de MDM2

Conception et caractérisation de composés macrocycliques ciblant GABARAP

Pour analyser plus en détail les RFpeptides, les chercheurs ont ensuite conçu un composé avec un site de liaison complètement différent de la structure de MCL1 et MDM2 - la protéine associée au récepteur de type A de l'acide gamma-aminobutyrique (GABARAP).

Les résultats expérimentaux montrent que, comme le montrent les figures AB et DE,GAB_D8 et GAB_D23 sont tous deux des composés efficaces pour GABARAP, montrant des affinités de 6 nM et 36 nM, respectivement, parmi lesquels GAB_D8 est le composé macrocyclique le plus efficace pour GABARAP trouvé jusqu'à présent.Comme le montrent les figures C et F ci-dessous, l'analyse de la structure cristalline aux rayons X a révélé que la structure du complexe GAB_D8-GABARAPL1 est très cohérente avec le modèle de conception, et la structure du complexe de GAB_D23 et GABARAP est également très cohérente avec le modèle de conception, ce qui vérifie l'exactitude des interactions clés dans le modèle de conception.

Conception de novo de liants macrocycliques à haute affinité pour GABARAP

Bien qu'il existe de légères différences entre le modèle conçu et la structure cristalline dans certains domaines, la prédiction basée sur l'alignement de séquences multiples (MSA) montre une plus grande cohérence avec la structure cristalline des rayons X. Comme le montre la figure GI ci-dessous, malgré ces légères différences, les prédictions MSA sont toujours plus cohérentes avec la structure cristalline obtenue expérimentalement.

Structure cristalline aux rayons X de GAB_D8/GAB_D23 lié à GABARAP

Conception et caractérisation de composés macrocycliques ciblant RbtA de structure inconnue

L’étude visait également à concevoir des composés macrocycliques pour des protéines cibles dont les structures expérimentales sont inconnues afin de déterminer si les RFpeptides peuvent réduire efficacement les risques de conception. Prenant l’exemple de RbtA, les chercheurs ont été les premiers à prédire sa structure protéique en utilisant AF2 et RF2, et les deux méthodes ont prédit des structures globales similaires. Sur cette base, les chercheurs ont choisi de concevoir des RFpeptides ciblant des régions censées être presque identiques entre AF2 et RF2. Les résultats montrent que, comme le montre la figure AB,RBB_D10 est un puissant composé macrocyclique de RbtA, affichant une affinité de liaison de 9,4 nM.

Conception précise de novo de liants peptidiques cycliques à haute affinité pour la structure RbtA

Pour confirmer le mode de liaison entre RbtA et RBB_D10, les chercheurs ont analysé plus en détail la structure cristalline aux rayons X à haute résolution de la liaison apo et RbtA. Comme le montre la figure C ci-dessus,La cristallographie aux rayons X a confirmé que la structure apo est très cohérente avec la structure prédite (RMSD 1,2 Å et 1,1 Å), et la structure complexe présentée dans la figure D ci-dessus correspond presque entièrement au modèle conçu (RMSD 1,4 Å).Comme le montre la figure 4E-H ci-dessus, la structure des rayons X du composé macrocyclique est presque cohérente avec le modèle conçu (RMSD 0,4 Å), ce qui vérifie la précision du modèle conçu.

David Baker : de la main de Dieu au prix Nobel

En tant que lauréat poids lourd du prix Nobel de chimie, le nom de David Baker est sans aucun doute un symbole retentissant dans le domaine de la recherche sur les protéines. En tant que l'une des figures clés de la prédiction de la structure des protéines par l'intelligence artificielle, David Baker a non seulement grandement favorisé les progrès de la prédiction de la structure des protéines, mais a également obtenu des résultats fructueux dans le domaine de la conception des protéines.

Dès 2003,L'équipe de David Baker a conçu la première nouvelle protéine qui n'est pas dérivée de la nature, Top7.Cette réalisation a non seulement étonné la communauté scientifique, mais a également représenté une avancée importante pour l’humanité dans le domaine de la conception de protéines de novo.

Article original :10.1126/science.1089427

Bien que la conception du Top7 soit impressionnante, il s'agit uniquement d'une conception basée sur une structure spécifique et n'a aucune fonction réelle. David Baker ne s’est pas arrêté là. Lui et son équipe ont continué à explorer et à essayer diverses méthodes de calcul, notamment des fonctions de calcul de l'énergie des protéines, des méthodes d'échantillonnage de chaînes principales et latérales multiples et des algorithmes d'optimisation globale tels que les simulations de Monte Carlo et les méthodes d'optimisation continue.

Avec le développement de l’IA générative et des technologies d’apprentissage automatique, il devient possible de concevoir de nouvelles protéines dotées de fonctions biologiques spécifiques. En juin 2024, l’équipe de David Baker a réalisé une autre avancée. Ils ont conçu une nouvelle protéine en forme d’anneau.Il régule la voie de signalisation du facteur de croissance des fibroblastes (FGF) et favorise la différenciation vasculaire. Ce travail élargit non seulement le champ d’application de la conception de protéines de novo, mais peut également avoir un impact profond sur le développement de ce domaine.

Article original :

https://www.cell.com/cell/fulltext/S0092-8674(24)00534-8

Les recherches de David Baker ont considérablement fait progresser le domaine de la conception des protéines. Sa percée dans la conception de protéines de novo indique que nous sommes au seuil d’une nouvelle ère, une ère dans laquelle les humains peuvent manipuler avec précision les éléments constitutifs de base de la vie. Le développement et l’application de ces technologies devraient permettre de résoudre une série de défis mondiaux.