David Bakers Neueste Arbeit! De Novo-design Des Makrozyklischen Peptidbindergerüsts RFpeptide Bietet Neue Möglichkeiten Für Nicht Medikamentös Behandelbare Proteine

Im langen Kampf der Menschheit gegen Krankheiten stand die Arzneimittelforschung und -entwicklung stets im Vordergrund der wissenschaftlichen Forschung. Unter ihnen sind niedermolekulare Arzneimittel aufgrund ihrer Vorteile wie einfache Herstellung, starke Zelldurchlässigkeit, bequeme orale Verabreichung und niedrige Herstellungskosten zur treibenden Kraft in der Arzneimittelforschung und -entwicklung geworden. Allerdings sind niedermolekulare Arzneimittel gegen Proteine, denen tiefe hydrophobe Taschen fehlen, oft wirkungslos. Mit dem Fortschritt der Wissenschaft können Makrozyklen mit ihrer einzigartigen dreidimensionalen Struktur und hohen Affinität molekulare Ziele regulieren, die mit herkömmlichen niedermolekularen Arzneimitteln nur schwer zu erreichen sind, und bieten so neue therapeutische Möglichkeiten für diese „medikamentös nicht behandelbaren“ Proteine.
Die traditionelle Arzneimittelentwicklung beruht jedoch auf der Entdeckung natürlicher Produkte oder auf Hochdurchsatz-Screening-Technologien, was zeitaufwändig und kostspielig ist. Die Entwicklung der KI hat zu neuen Durchbrüchen in der Arzneimittelentwicklung geführt. Kürzlich,Das Team von David Baker, einem herausragenden Computerbiologen und Direktor des Washington Institute for Protein Research, der 2024 den Nobelpreis für Chemie erhalten hat, hat eine innovative, auf Diffusionsmodellen basierende Technologie namens RFpeptides entwickelt, um hochaffine makrozyklische Peptidbinder für eine Vielzahl von Proteinzielen zu entwerfen.
Insbesondere verwendet die Technologie modifiziertes RoseTTAFold und RFdiffusion mit Schleifen-Relativpositionskodierung, um genaue makrozyklische Skelette zu erzeugen, integriert ProteinMPNN und Rosetta Relax zur Sequenzoptimierung und kann ein zielgerichtetes und effizientes makrozyklisches Design erreichen, was neue Möglichkeiten für die Arzneimittelentwicklung und Diagnosetechnologie eröffnet. Die Studie mit dem Titel „Accurate de novo design of high-affinity protein binding macrocycles using deep learning“ wurde als Vorabdruck auf bioRxiv veröffentlicht.
Forschungshighlights:
* RFpeptides zeichnet sich durch die Entwicklung von Makrozyklen mit unterschiedlichen Sekundärstrukturen aus, darunter α-Helix-, β-Faltblatt- und Schleifenkonformationen, die auf spezifische Proteinschnittstellen zugeschnitten werden können und so therapeutische und diagnostische Anwendungen vorantreiben.
* RFpeptide entwickelte Makrozyklen, die auf MCL1, MDM2, GABARAP und RbtA abzielen, zeigten alle eine hohe Bindungsaffinität
* RFpeptide können neue Binder für Proteine mit ungelösten Strukturen entwickeln und so die Regeln für die gezielte Ansteuerung wenig erforschter oder nicht charakterisierter Proteine verändern.

Papieradresse:
https://doi.org/10.1101/2024.11.18.622547
Folgen Sie dem offiziellen Konto und antworten Sie mit „大环设计“, um das vollständige PDF zu erhalten
Das Open-Source-Projekt „awesome-ai4s“ vereint mehr als 100 AI4S-Papierinterpretationen und stellt umfangreiche Datensätze und Tools bereit:
https://github.com/hyperai/awesome-ai4s
Datensatz: Targeting von MCL1, MDM2, GABARAP und RbtA, Auswahl von Zielproteinen für das Makrozyklus-Design
In der De-novo-Designstudie zu makrozyklischen Bindemitteln wählte das Forschungsteam MCL1, das eine Schlüsselrolle in der Krebsbehandlung spielt, als erstes Zielprotein.Mithilfe der RFpeptides-Technologie erzeugte der Forscher 9.965 verschiedene zyklische Peptid-Backbones und entwarf mithilfe der Designprozesse ProteinMPNN und Rosetta Relax 4 Aminosäuresequenzen für jedes Backbone. Nach einem Screening auf Basis von Deep Learning und physikalischen Indikatoren wurden schließlich 27 Designs für die experimentelle Charakterisierung ausgewählt.
Die Studie zielte auch auf MDM2 ab, das mit dem Tumorsuppressorprotein p53 interagiert.Es wurden zehntausend makrozyklische Grundgerüste erzeugt und für jedes Grundgerüst vier Aminosäuresequenzen entworfen. Von den 40.000 von AfCycDesign vorhergesagten Designs wurde angenommen, dass 7.495 effektiv an MDM2 binden.
Bei der Entwicklung makrozyklischer GABARAP-VerbindungenDas Forschungsteam definierte sechs Hotspot-Reste, generierte 20.000 makrozyklische Rückgrate und entwarf Aminosäuresequenzen. Aus 80.000 Designs wurden 335 makrozyklische Designs für die Untersuchung ausgewählt.
Für RbtA,Das Forschungsteam verwendete AF2 und RF2, um seine Struktur vorherzusagen, definierte 7 Hotspot-Reste, generierte 20.000 Hauptketten und entwarf 4 Aminosäuresequenzen für jede Hauptkette. Dabei kamen im Designprozess iterative Verfahren ProteinMPNN und Rosetta Relax zum Einsatz.
RFpeptide: Eine generative Deep-Learning-Pipeline für das De-novo-Design von Makrozyklen, die auf Zielproteine abzielen
RFpeptides ermöglicht ein gezieltes und effizientes Makrozyklus-Design. Insbesondere nutzt es modifiziertes RoseTTAFold und RFdiffusion mit Schleifen-Relativpositionskodierung, um genaue Makrozyklus-Rückgrate zu erzeugen, und integriert ProteinMPNN und Rosetta Relax zur Sequenzoptimierung.

RFpeptide: Eine weitere Erweiterung von RoseTTAFold2 und RFdiffusion
In der Studie wurde zunächst die Modellierungsfähigkeit des Strukturvorhersagenetzwerks RoseTTAFold2 (RF2) für bekannte zyklische Peptidstrukturen bewertet. Wie in Abbildung A unten gezeigt, haben die Forscher durch die Einführung eines zyklischen relativen Positionskodierungsmechanismus entscheidende Verbesserungen an RF2 vorgenommen und beobachtet, dass dieser robuste Vorhersagen natürlicher zyklischer Peptidstrukturen ermöglichte.

Angesichts dieses Erfolgs kamen die Forscher zu dem Schluss, dass die zyklische relative Positionskodierung aufgrund einer ähnlichen Netzwerkarchitektur auch die RF-Diffusion zur Erzeugung makrozyklischer Peptidstrukturen ermöglichen könnte. Daher wurde in dieser Studie, wie in Abbildung BC oben gezeigt, die Kodierung der relativen Schleifenposition zur RF-Diffusion hinzugefügt und die robuste Erzeugung diversifizierter makrozyklischer Peptide erfolgreich beobachtet.
Inspiriert von der Übertragbarkeit der relativen Positionskodierung von Schleifen begann das Forschungsteam, RF-Diffusion für das De-novo-Design proteinbindender Makroschleifen zu verwenden. Wie in Abbildung D unten gezeigt, wurde in dieser Studie eine kreisförmige relative Positionskodierung im RFdiffusion-Proteindesignprozess verwendet, um eine Kodierung für die generierten Ketten bereitzustellen. Anschließend wurde ProteinMPNN, wie in Abbildung E unten gezeigt, verwendet, um Aminosäuresequenzen zu entwerfen, die zum makrozyklischen Rückgrat passten, um die Konstruktion der RFpeptide abzuschließen. Wie in Abbildung F unten gezeigt, RFpeptide können schnell makrozyklische Verbindungen mit verschiedenen Sekundärstrukturen gegen Zielproteine erzeugen.

Makrozyklische Verbindungen: Verfeinertes Screening basierend auf RFpeptid-Designprodukten
Nachdem mithilfe von RFpeptiden diverse makrozyklische Verbindungsgerüste für verschiedene Ziele erzeugt wurden, wurden in der Studie weiterhin ProteinMPNN und Rosetta Relax eingesetzt, um lokale Änderungen an den erzeugten Hauptketten vorzunehmen und so eine Diversität der Aminosäuresequenzen zu erreichen.
Zunächst verwendeten die Forscher AfCycDesign auf der Grundlage von iPAE, der Bewertung der Modellähnlichkeit und einem RF2-gestützten Screening, um Protein-Makrozyklus-Komplexe, die unter Verwendung von Makrozyklussequenzen und Zielstrukturen als Vorlagen entwickelt wurden, erneut vorherzusagen, und wählten Designs mit hoher Zuverlässigkeit aus.
Zweitens wurden in der Studie mithilfe von Rosetta Qualitätsindikatoren wie Bindungsaffinität (ddG), räumliche Aggregationstendenz der entworfenen Makrozyklen (SAP) und molekulare Oberfläche des Grenzflächenkontakts (CMS) berechnet, um das Screening der Kandidaten zu verfeinern.
Schließlich wählten die Forscher eine Handvoll geprüfter Designs aus, ermittelten ihre Bindungsaffinitäten in Experimenten durch chemische Synthese und biochemische Charakterisierung und überprüften sie durch Vergleichstests, um die Genauigkeit und Wirksamkeit der Designs sicherzustellen.
Nahezu perfekte Genauigkeit bestätigt die Bindungsvorhersagekraft von RFpeptiden
Design und Charakterisierung makrozyklischer Verbindungen, die auf MCL1 und MDM2 abzielen
Um die Wirksamkeit der RFpeptide zu überprüfen, wählten die Forscher zunächst das Myeloidzell-Leukämieprotein 1 (MCL1) als erstes Zielprotein aus und führten eine experimentelle Charakterisierung durch. Wie in Abbildung AB unten gezeigt,Die Forscher fanden heraus, dass MCB_D2 (lila) am stärksten an MCL1 (graue Oberfläche) band und eine Bindungsaffinität von 2 μM aufwies.
Um zu bestätigen, ob der Makrozyklus in der vorgesehenen Weise gebunden war, ermittelten die Forscher die Röntgenkristallstruktur von MCB_D2, gebunden an MCL1. Wie in Abbildung C unten gezeigt,Die Kristallstruktur ist nahezu identisch mit dem entworfenen Modell.Der Cα-RMSD beträgt 0,7 Å. Wie in Abbildung D unten gezeigt, beträgt der Cα-RMSD 0,4 Å, wenn der Makrozyklus mit der Kristallstruktur überlagert wird, und die Seitenkettenkonformationen der interagierenden Reste in der Kristallstruktur liegen ebenfalls sehr nahe am entworfenen Modell. Bei einer weiteren Kristallstrukturanalyse zeigten die Abbildungen E und F auch, dass die Schleifenregion von MCB_D2 hydrophobe Kontakte und Kation-π-Wechselwirkungen mit MCL1 aufwies.

Inspiriert durch die experimentelle Bestätigung der Bindung von MCL1 an zirkuläre Moleküle machte sich das Forschungsteam anschließend daran, Bindemittel für MDM2 zu entwickeln. Wie in der folgenden Abbildung GI gezeigt,Die Forscher fanden heraus, dass MDB_D8 die beste makrozyklische Verbindung für MDM2 war und eine hohe Affinität von 1,9 μM aufwies.Darüber hinaus weisen die durch Computermodellierung vorhergesagten Schlüsselkontaktpunkte an der Schnittstelle Ähnlichkeiten mit den in der nativen MDM2-p53-Komplexstruktur beobachteten Interaktionen auf.

Design und Charakterisierung makrozyklischer Verbindungen gegen GABARAP
Um RFpeptide weiter zu analysieren, entwickelten die Forscher als nächstes eine Verbindung mit einer völlig anderen Bindungsstelle als die Struktur von MCL1 und MDM2 – Gamma-Aminobuttersäure-Typ-A-Rezeptor-assoziiertes Protein (GABARAP).
Die experimentellen Ergebnisse zeigen, dass, wie in den Abbildungen AB und DE gezeigt,Sowohl GAB_D8 als auch GAB_D23 sind wirksame Verbindungen für GABARAP und weisen Affinitäten von 6 nM bzw. 36 nM auf, wobei GAB_D8 die bislang wirksamste makrozyklische Verbindung für GABARAP ist.Wie in den Abbildungen C und F unten gezeigt, ergab die Röntgenkristallstrukturanalyse, dass die Struktur des GAB_D8-GABARAPL1-Komplexes in hohem Maße mit dem Designmodell übereinstimmt und die Struktur des Komplexes aus GAB_D23 und GABARAP ebenfalls in hohem Maße mit dem Designmodell übereinstimmt, was die Genauigkeit der Schlüsselinteraktionen im Designmodell bestätigt.

Obwohl es in einigen Bereichen leichte Unterschiede zwischen dem entworfenen Modell und der Kristallstruktur gibt, weist die auf der multiplen Sequenzalignment-Analyse (MSA) basierende Vorhersage eine höhere Übereinstimmung mit der Röntgenkristallstruktur auf. Wie in Abbildung GI unten gezeigt, stimmen die MSA-Vorhersagen trotz dieser geringfügigen Unterschiede immer noch besser mit der experimentell erhaltenen Kristallstruktur überein.

Design und Charakterisierung makrozyklischer Verbindungen gegen RbtA unbekannter Struktur
Ziel der Studie war es außerdem, makrozyklische Verbindungen für Zielproteine mit unbekannten experimentellen Strukturen zu entwerfen, um zu spekulieren, ob RFpeptide die Designrisiken wirksam reduzieren können. Am Beispiel von RbtA waren Forscher die ersten, die dessen Proteinstruktur mithilfe von AF2 und RF2 vorhersagten, und die beiden Methoden sagten ähnliche Gesamtstrukturen voraus. Auf dieser Grundlage entschieden sich die Forscher für die Entwicklung von RFpeptiden, die auf Regionen abzielen, von denen angenommen wird, dass sie bei AF2 und RF2 nahezu identisch sind. Die Ergebnisse zeigen, dass, wie in Abbildung AB dargestellt,RBB_D10 ist eine potente makrozyklische Verbindung von RbtA mit einer Bindungsaffinität von 9,4 nM.

Um den Bindungsmodus zwischen RbtA und RBB_D10 zu bestätigen, analysierten die Forscher zusätzlich die hochauflösende Röntgenkristallstruktur der Apo- und RbtA-Bindung. Wie in Abbildung C oben gezeigt,Durch Röntgenkristallographie wurde bestätigt, dass die Apo-Struktur in hohem Maße mit der vorhergesagten Struktur übereinstimmt (RMSD 1,2 Å und 1,1 Å) und dass die in Abbildung D oben dargestellte komplexe Struktur fast vollständig mit dem entworfenen Modell übereinstimmt (RMSD 1,4 Å).Wie in Abbildung 4E-H oben gezeigt, stimmt die Röntgenstruktur der makrozyklischen Verbindung nahezu mit dem entworfenen Modell überein (RMSD 0,4 Å), was die Genauigkeit des entworfenen Modells bestätigt.
David Baker: Von der Hand Gottes zum Nobelpreisträger
Als bedeutender Gewinner des Nobelpreises für Chemie ist David Bakers Name zweifellos ein klingendes Symbol auf dem Gebiet der Proteinforschung. Als eine der Schlüsselfiguren in der Vorhersage von Proteinstrukturen durch künstliche Intelligenz hat David Baker nicht nur den Fortschritt der Proteinstrukturvorhersage erheblich vorangetrieben, sondern auch fruchtbare Ergebnisse auf dem Gebiet des Proteindesigns erzielt.
Bereits 2003Das Team von David Baker hat das erste neue Protein entwickelt, das nicht aus der Natur stammt: Top7.Diese Leistung hat nicht nur die wissenschaftliche Gemeinschaft überrascht, sondern stellte auch einen wichtigen Durchbruch für die Menschheit auf dem Gebiet des De-novo-Proteindesigns dar.
Originalarbeit:10.1126/science.1089427
Obwohl das Design von Top7 beeindruckend ist, handelt es sich lediglich um ein Design, das auf einer bestimmten Struktur basiert und keine tatsächliche Funktion hat. David Baker hat es hier nicht belassen. Er und sein Team erforschten und probierten weiterhin verschiedene Rechenmethoden aus, darunter Funktionen zur Berechnung der Proteinenergie, Methoden zur Stichprobennahme für mehrere Rückgrate und Seitenketten sowie globale Optimierungsalgorithmen wie Monte-Carlo-Simulationen und kontinuierliche Optimierungsmethoden.
Mit der Entwicklung generativer KI- und maschineller Lerntechnologien wird es möglich, neue Proteine mit spezifischen biologischen Funktionen zu entwerfen. Im Juni 2024 gelang dem Team von David Baker ein weiterer Durchbruch. Sie entwarfen ein neues ringförmiges Protein.Es reguliert den Signalweg des Fibroblasten-Wachstumsfaktors (FGF) und fördert die Gefäßdifferenzierung. Diese Arbeit erweitert nicht nur den Anwendungsbereich des De-novo-Proteindesigns, sondern könnte auch einen tiefgreifenden Einfluss auf die Entwicklung dieses Bereichs haben.
Originalarbeit:
https://www.cell.com/cell/fulltext/S0092-8674(24)00534-8
Die Forschung von David Baker hat das Gebiet des Proteindesigns erheblich vorangebracht. Sein Durchbruch im De-novo-Proteindesign zeigt, dass wir an der Schwelle zu einer neuen Ära stehen, einer Ära, in der der Mensch die Grundbausteine des Lebens präzise manipulieren kann. Die Entwicklung und Anwendung dieser Technologien dürften zur Lösung einer Reihe globaler Herausforderungen beitragen.
