HyperAI

AlphaFold 3 Ist Da! Closed Source, Aber Für Die Wissenschaftliche Forschung Verfügbar. Die Tochtergesellschaft Von DeepMind Ist in Greifbarer Nähe Und Treibt Zunächst Die Kommerzielle Nutzung Voran?

特色图像

Am 8. Mai Ortszeit haben Google DeepMind und seine Tochtergesellschaft Isomorphic Labs gemeinsam AlphaFold 3 veröffentlicht.

DeepMind sagte, dass AlphaFold 3 die Strukturen und Wechselwirkungen aller Lebensmoleküle (Proteine, DNA, RNA, Liganden usw.) mit beispielloser Genauigkeit erfolgreich vorhergesagt habe. Im Vergleich zu bestehenden VorhersagemethodenAlphaFold 3 fand mindestens 50% mehr Interaktionen zwischen Proteinen und anderen Molekültypen und für einige wichtige Interaktionskategorien verdoppelte sich seine Vorhersagegenauigkeit.

Leser, die AI for Science verfolgen, sind sicherlich mit AlphaFold vertraut, das bei seiner Erstveröffentlichung als „Meilenstein des Durchbruchs“ gepriesen wurde. AlphaFold 2 wurde 2021 von Science zum „Durchbruch des Jahres“ und von Nature zur „Methode des Jahres“ gekürt, da es wegweisend ist und ständig die Anwendungsgrenzen von KI + Biologie überschreitet.

Heute hat AlphaFold 3 das Bewusstsein der Menschen erneut aufgefrischt. Wie wird erreicht, dass „alle Lebensmoleküle vorhersehbar sind“? Welche Durchbrüche wurden in Technologie und Leistung erzielt? Welche Rolle spielt Isomorphic Labs, das aus DeepMind hervorgegangen ist?

Pairformer-Modul ersetzt Evoformer, Diffusionsmodul ersetzt Strukturmodul

Die Forscher haben die Struktur und die Trainingsverfahren von AlphaFold 2 erheblich verbessert, um allgemeinere chemische Strukturen zu berücksichtigen und die Dateneffizienz des Modelllernens zu verbessern. Anhand einer Liste molekularer Eingaben kann AlphaFold 3 nun deren gemeinsame 3D-Struktur generieren und zeigen, wie sie zusammenpassen.

AlphaFold 3 Gesamtstruktur

Wie in der Abbildung oben gezeigt, ähnelt die Gesamtstruktur von AlphaFold 3 der von AlphaFold 2. Beide verfügen über ein großes Rückgrat für die Entwicklung von Paardarstellungen chemischer Komplexe. AlphaFold 3 ersetzt den Evoformer von AlphaFold 2 durch ein einfacheres Pairformer-Modul.Dadurch wird der Aufwand für die Verarbeitung der Mehrfachsequenzalignmente (MSA) reduziert und die Anzahl der MSA-Module auf 4 verringert. Die MSA-Darstellung von AF3 wird mit der günstigeren Methode der paargewichteten Mittelwertbildung verarbeitet und in den nachfolgenden Verarbeitungsschritten wird nur die paarweise Darstellung verwendet.

Gesamtstruktur des Diffusionsmoduls

Die Forscher stellten in AlphaFold 2 fest, dass die Beseitigung des größten Teils der Komplexität des Strukturmoduls nur geringe Auswirkungen auf die Vorhersagegenauigkeit hatte, während die Beibehaltung des Rückgratgerüsts und der Seitenkettentorsionsdarstellung die Komplexität allgemeiner Molekülgraphen erhöhte.

Also in AlphaFold 3,Die Ingenieure verwendeten das Diffusionsmodul zur direkten Vorhersage roher Atomkoordinaten und ersetzten damit das AlphaFold 2-Strukturmodul, das auf der Basis aminosäurespezifischer Frameworks und Seitenketten-Torsionswinkeln arbeitet.Letzteres verwendet eine paarweise Darstellung, um explizite Atompositionen zu generieren. Die mehrskalige Natur des Diffusionsprozesses (durch niedriges Rauschen hervorgerufenes Netzwerk mit verbesserter lokaler Struktur) ermöglicht außerdem die Beseitigung stereochemischer Verluste und die spezielle Behandlung von Bindungsmustern im Netzwerk, wodurch beliebige chemische Zusammensetzungen leicht bewältigt werden können.

Speziell,Das Diffusionsmodul kann direkt mit Rohatomkoordinaten und groben abstrakten Beschriftungsdarstellungen arbeiten, ohne dass Rotationsrahmen oder eine isovariante Verarbeitung erforderlich sind.Die Forscher trainierten zunächst das Diffusionsmodell, um „verrauschte“ Atomkoordinaten zu empfangen und dann die wahren Koordinaten vorherzusagen. Dieser Prozess erfordert, dass das Modell Proteinstrukturen auf verschiedenen Längenskalen lernt, wobei die Rauschunterdrückungsaufgabe bei geringem Rauschen das Verständnis sehr lokaler Stereochemie betont, während die Rauschunterdrückungsaufgabe bei hohem Rauschen die großräumige Struktur des Systems betont.

Zum Zeitpunkt der Inferenz prüft das Modell zunächst das zufällige Rauschen und führt dann eine wiederkehrende Rauschunterdrückung durch, um die endgültige Struktur zu generieren. Es ist erwähnenswert, dass AlphaFold 3 ein generatives Trainingsverfahren ist, das eine Verteilung von Antworten erzeugt. Dies bedeutet, dass das Modell für jede Antwort, auch wenn es sich über ihre Position nicht sicher ist, auch ihre lokale Struktur (wie etwa die Geometrie der Seitenkettenbindungen) bestimmen kann. daher,AlphaFold 3 vermeidet sowohl die torsionsbasierte Parametrisierung von Rückständen als auch Strafen für Strukturverletzungen und bewältigt gleichzeitig die Komplexität allgemeiner Liganden.

Leistungsvergleich auf PoseBusters

Wie in der obigen Abbildung gezeigt, erreichte die Erfolgsrate von AlphaFold 3 beim Leistungsvergleich zur Vorhersage der Protein-dsDNA (Protein-Doppelstrang-DNA-Interaktion) 64,81 TP3T, während RosettaAlphaFold2NA nur 28,31 TP3T hatte. Bei der Protein-Antikörper-Vorhersage (Interaktion zwischen Protein und Antikörper) hat AlphaFold 3 eine genaue Erfolgsrate von 62,91 TP3T, während andere Systeme nur 29,61 TP3T haben.

* RosettaAlphaFold2NA kombiniert Rosettas klassische Modellierungstechnologie mit AlphaFold 2.

Die Wachstumsgeschichte von AlphaFold: ein hervorragender Student mit vier aufeinanderfolgenden Sprüngen in 6 Jahren

Nachdem AlphaGo den internationalen Go-Meister Lee Sedol besiegt hatte, rückte die „Alpha-Serie“ offiziell ins Blickfeld der Öffentlichkeit. Laut DeepMind begann das Team 2016, fast unmittelbar nachdem AlphaGo berühmt wurde, mit der Erforschung des Problems der Proteinfaltung.

Beim 13. CASP (Critical Assessment of Protein Structure Prediction) Ende 2018AlphaFold belegte unter 98 Teilnehmern den ersten Platz und sagte die Strukturen von 25 von 43 Proteinen genau voraus.Der Zweitplatzierte in der gleichen Gruppe hatte nur 3 Optionen richtig vorhergesagt.

Zu diesem Zeitpunkt hatte das AlphaFold der „ersten Generation“ bereits eine erstaunliche Stärke bewiesen. AlphaFold 1 wurde anhand von Tausenden bekannter Proteine trainiert. Dabei wurden neuronale Netzwerke verwendet, um die Abstände zwischen Aminosäurepaaren und die Winkel zwischen den sie verbindenden chemischen Bindungen vorherzusagen. Anschließend wurde die vorläufige Struktur angepasst, um die energieeffizienteste Anordnung zu finden.

Das Team stellte jedoch fest, dass der Ansatz von AlphaFold 1, der lokale Physik und aus der Mustererkennung abgeleitete Leitpotentiale kombiniert, dazu neigt, Wechselwirkungen zwischen in einer Sequenz nahe beieinander liegenden Resten im Vergleich zu Wechselwirkungen zwischen Resten, die entlang der Kette weit auseinander liegen, zu stark zu berücksichtigen. Infolgedessen neigt AlphaFold 1 dazu, Modelle mit etwas mehr Sekundärstruktur (α-Helices und β-Faltblätter) auszuwählen, als tatsächlich der Fall ist (eine Art Überanpassung).

Aus technischer Sicht besteht das von AlphaFold 1 verwendete Softwaredesign aus mehreren Modulen, von denen jedes einzeln trainiert wird, um gelenktes Potenzial zu erzeugen und dann mit physikbasiertem Energiepotenzial kombiniert zu werden.

Daher kombiniert AlphaFold 2, das 2020 veröffentlicht wurde, Subnetzwerke mit einem einzigen differenzierbaren End-to-End-Modell.Das System basiert vollständig auf Mustererkennung und wird im Ensemble-Stil als einzelne Ensemblestruktur trainiert.

AlphaFold 2 erzielte hochpräzise Vorhersagen von Proteinmonomerstrukturen und das DeepMind-Team wandte seine Aufmerksamkeit dann weiter der Vorhersage von Komplexen zu. Im Oktober 2021 veröffentlichte DeepMind ein Update namens AlphaFold-Multimer.Es ist eine Erweiterung von AlphaFold 2 und kann Komplexe verschiedener Proteine modellieren.

Tutorial zur Bereitstellung von AlphaFold 2 mit einem Klick:

https://openbayes.com/console/public/tutorials/m6k2bdSu30C

Die Forscher testeten 4.433 Proteinkomplexe und untersuchten die Vorhersagegenauigkeit von AlphaFold-Multimer an den Kontaktschnittstellen von Heteropolymeren und Homopolymeren. Sie erreichten 67% bzw. 69%, wobei hochgenaue Vorhersagen für 23% bzw. 34% erzielt wurden.

Anschließend überraschte AlphaFold, um das es zwei Jahre lang still gewesen war, erneut alle. Neben der weiteren Verbesserung der Genauigkeit der Proteinstrukturvorhersage wurden auch RAN-Vorhersagefunktionen hinzugefügt. Der letzte Tag im Oktober 2023,DeepMind hat die neuesten Fortschritte bei AlphaFold veröffentlicht (im Dokument hieß es „AlphaFold-latest“, nun scheint es sich jedoch um AlphaFold 3 zu handeln).

Papieradresse:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/a-glimpse-of-the-next-generation-of-alphafold/alphafold_latest_oct2023.pdf

DeepMind sagte, dass das AlphaFold-Modell der neuen Generation fast alle Moleküle in der Proteindatenbank (PDB) mit einer Vorhersagegenauigkeit auf atomarer Ebene vorhersagen kann, was nicht nur ein neues Verständnis mehrerer Schlüsselkategorien biologischer Makromoleküle ermöglicht, sondern auch die Vorhersagegenauigkeit erheblich verbessert. Zu diesen Biomakromolekülklassen gehören Liganden (kleine Moleküle), Proteine, Nukleinsäuren (DNA und RNA) und Biomakromoleküle mit posttranslationalen Modifikationen (PTMs).

Nach langer Vorfreude ist endlich die neue Generation des AlphaFold 3 erschienen, die seit Ende 2023 für Begeisterung sorgt. Seine Fähigkeiten haben die Industrie und die Wissenschaft offensichtlich nicht enttäuscht, aber es gibt noch wichtigere Angelegenheiten, die gemeinsame Anstrengungen aller Parteien erfordern, um sie voranzutreiben -Wie man AlphaFold 3 aus dem Labor in die pharmazeutische Produktionslinie bringt, wie man mehr wissenschaftlichen Forschungsteams die Nutzung dieses fortschrittlichen Tools zur Optimierung des Forschungsprozesses ermöglicht usw.Weiterhin sind Aufmerksamkeit und Investitionen erforderlich.

DeepMind-Tochter Isomorphic Labs entsteht

Es ist erwähnenswert, dass bei der Veröffentlichung von AlphaFold 3 auch ein nicht zu übersehendes Team mitgewirkt hat – Isomorphic Labs.

Dieses aus DeepMind hervorgegangene Unternehmen wurde im November 2021 gegründet.Der Name ist von der möglichen isomorphen Abbildung zwischen Biologie und Informationswissenschaft inspiriert. Isomorphic Labs stützt sich auf AlphaFold und konzentriert sich auf den Bereich der KI-Medizin. Dabei geht es ihm um die Nutzung künstlicher Intelligenz und maschineller Lernmethoden, um den Prozess der Arzneimittelentdeckung zu beschleunigen und zu verbessern und so Behandlungsmöglichkeiten für einige der verheerendsten Krankheiten der Menschheit zu finden.

Im Mai 2022 gab Isomorphic Labs die erste Phase seines hochkarätig besetzten Managementteams bekannt.

Demis Hassabis, bekannt als „Vater von AlphaGo“, fungiert als CEO des Unternehmens. Chief Scientific Officer ist Miles Congreve, der an der Entwicklung von 20 klinisch erprobten Medikamenten beteiligt war und Miterfinder von Kisqali® (Ribociclib) ist, einem bereits vermarkteten Medikament zur Behandlung von Brustkrebs. Chief Technology Officer Sergei Yakneen verfügt über mehr als 20 Jahre Erfahrung in den Bereichen Ingenieurwesen, maschinelles Lernen, Produkte, Biowissenschaften und medizinische Forschung. Max Jaderberg, Doktor der Universität Oxford, ist Direktor für maschinelles Lernen …

In den rund zwei Jahren seit seiner Gründung hat das in London ansässige Unternehmen Isomorphic außer der anfänglichen Bekanntgabe des Managementteams keine Neuigkeiten zu seiner Arbeit veröffentlicht. Erst in einem Exklusivinterview mit Endpoints News im Jahr 2023 enthüllte Demis Hassabis erstmals seine Vision für Isomorphic.

Im Interview sagte Demis Hassabis über die Hauptarbeit des Unternehmens seit November 2021:Wir konzentrieren uns zunächst auf den Bereich der kleinen Moleküle, da wir dort schnell die größte Wirkung erzielen können. Darüber hinaus interessieren wir uns auch für den Interaktionsbereich – Protein-Ligand-Interaktionen, Protein-Protein-Interaktionen und die dynamische Natur der Biologie. Und dann beschäftigen wir uns auch mit der Chemie, um die Strukturen von Verbindungen zu verstehen, wie sie an Zielmoleküle binden, wie ihre Bindungsaffinität ist usw.

Auf die Frage, ob derzeit mit der Industrie am Aufbau einer Pipeline gearbeitet wird, sagte Demis Hassabis: „Wir werden Ziele und Programme auswählen, die unserer Meinung nach besonders gut zu unserer Technologie-Roadmap passen, und bei interessanten Zielen mit großen Pharmaunternehmen zusammenarbeiten. Weitere Informationen können zu einem späteren Zeitpunkt bekannt gegeben werden.“

Im Januar 2024 gab Isomorphic Labs zwei Arzneimittelentwicklungsvereinbarungen im Wert von 3 Milliarden US-Dollar mit Eli Lilly und Novartis bekannt. Demis Hassabis erklärte, dass „Isomorphic zwar zuvor Vorgespräche mit anderen großen Pharmaunternehmen geführt habe, Eli Lilly und Novartis jedoch großen Wert auf eine Zusammenarbeit legen.“ Gleichzeitig ist das Hauptziel dieser Zusammenarbeit klar: die Herstellung von Medikamenten, und nicht die Beschränkung auf Pilotprojekte oder akademische Zusammenarbeit.

Konkret geht es bei der Zusammenarbeit mit Eli Lilly um die Entwicklung von Therapeutika, die auf mehrere krankheitsbezogene Proteine und Signalwege abzielen. In diesem Zusammenhang betonte Demis Hassabis: „Die Anwendung unserer proprietären Technologieplattform, AlphaFold der nächsten Generation und unserer groß angelegten Rechenkapazitäten auf die Entwicklungsprojekte von Eli Lilly wird gemeinsam die Entwicklung bahnbrechender Medikamente vorantreiben.“

Die Zusammenarbeit mit Novartis konzentriert sich auf die Entdeckung niedermolekularer Therapeutika gegen drei noch nicht genannte Zielmoleküle. Fiona Marshall, Präsidentin von Novartis BioMedical Research, sagte: „Diese Zusammenarbeit vereint die einzigartigen Stärken beider Unternehmen – von künstlicher Intelligenz und Datenwissenschaft bis hin zu medizinischer Chemie und tiefgreifender Expertise in verschiedenen Krankheitsbereichen –, um neue Möglichkeiten in der KI-gestützten Arzneimittelforschung zu schaffen.“

Heute dürfte die Veröffentlichung von AlphaFold 3 die technische Stärke von Isomorphic Labs weiter verbessern, aus Anwendungssicht hat der Investitionsboom bei KI-Pharmazeutika in den letzten Jahren jedoch nachgelassen. Angesichts der hohen F&E-Kosten ist die Frage, wie sich fortschrittliche Technologien in tatsächliche Ergebnisse umsetzen lassen, eine wichtige Frage für die zukünftige Ausrichtung des Unternehmens. Mit der starken Unterstützung von DeepMind hoffen wir außerdem, dass AlphaFold 3 so schnell wie möglich tatsächlich in der Branche Einzug hält.

Noch etwas: AlphaFold Server

AlphaFold 3 ist das erste KI-System, das physikbasierte Tools zur Vorhersage biomolekularer Strukturen übertrifft, und es gibt derzeit keine Pläne, den vollständigen Code als Open Source bereitzustellen.Das Forschungsteam hat jedoch eine öffentliche Schnittstelle für das Modell veröffentlicht, den AlphaFold Server, der nichtkommerzielle Forschung unterstützt und Forschern auf der ganzen Welt die Tür öffnet.

Besuchen Sie die offizielle Website des AlphaFold-Servers:

alphafoldserver.com

Mit nur wenigen Mausklicks können Biologen mit AlphaFold 3 Strukturen aus Proteinen, DNA, RNA und ausgewählten Liganden, Ionen und chemischen Modifikationen modellieren und vorhersagen, wie Proteine mit anderen Molekülen in der Zelle interagieren. Die Plattform kann Wissenschaftlern dabei helfen, neue Hypothesen für Tests im Labor zu entwickeln und Arbeitsabläufe zu beschleunigen. Sie kann unabhängig davon eingesetzt werden, ob die Wissenschaftler über ausreichende Computerressourcen oder Fachkenntnisse im maschinellen Lernen verfügen.

Céline Bouchoux, Wissenschaftlerin im Uhlmann-Labor am Francis Crick Institute, lobte dies: „Mit AlphaFold Server geht es nicht mehr nur darum, Strukturen vorherzusagen, sondern auch darum, großzügig Zugriff zu gewähren. So können Forscher mutige Fragen stellen und Entdeckungen beschleunigen.“

Es besteht kein Zweifel, dass die Einführung von AlphaFold 3 nicht nur einen großen Fortschritt in der wissenschaftlichen Erforschung darstellt, sondern auch ein wichtiges Instrument für den Beginn einer neuen Ära der biomedizinischen Forschung und Entwicklung ist. Es wurden bedeutende Durchbrüche bei der Simulation vieler unterschiedlicher Arten molekularer Interaktionen erzielt, was für Forschungs- und Entwicklungsprojekte, wie etwa die genaue Identifizierung von Arzneimittelzielen, von entscheidender Bedeutung ist.

Das DeepMind-Team ist voller Erwartungen: „Wir haben gerade erst begonnen, das Potenzial von AlphaFold 3 zu erkunden und können es kaum erwarten, zu sehen, was in der Zukunft passiert.“

Quellen:
1.https://cloud.tencent.com/developer/article/2017961
2.https://hub.baai.ac.cn/view/31181
3.https://zh.wikipedia.org/wiki/AlphaFold
4.https://mp.weixin.qq.com/s/18cNw-E-5vU3vKb1J4WWKg