Ein All-Atom Generatives Modell für die Entwurf von Proteinkomplexen

Eiweiße existieren in der Regel in Komplexen und interagieren mit anderen Eiweißen oder Biomolekülen, um ihre spezifischen biologischen Funktionen auszuführen. Die Forschung zum Modellieren einzelner Eiweißketten wurde intensiv und tiefgreifend untersucht, wobei Fortschritte bei Modellen wie der Reihe ESM und AlphaFold2 zu verzeichnen waren. Trotz dieser Entwicklungen bleibt die Untersuchung und das Modellieren von mehrfachkettigen Eiweißen weitgehend unerforscht, obwohl sie für das Verständnis biologischer Funktionen von entscheidender Bedeutung sind. In Anerkennung der Wichtigkeit dieser Interaktionen stellen wir APM (all-Atom Protein generative Model) vor, ein Modell, das speziell für das Modellieren von mehrfachkettigen Eiweißen entwickelt wurde. Durch die Integration von Atominformationen und die Nutzung von Daten zu mehrfachkettigen Eiweißen ist APM in der Lage, interkettige Interaktionen präzise zu modellieren und Eiweißkomplexe mit Bindungsfähigkeiten ab initio zu entwerfen. Es führt auch Faltungs- und invers-Faltungs-Aufgaben für mehrfachkettige Eiweiße durch. Darüber hinaus zeigt APM Vielseitigkeit in nachgelagerten Anwendungen: Es erzielt verbesserte Leistungen durch überwachtes Feinjustierung (SFT) und unterstützt gleichzeitig auch Null-Shot-Sampling in bestimmten Aufgaben, wodurch es den aktuellen Stand der Technik erreicht. Unser Code ist unter https://github.com/bytedance/apm veröffentlicht.