PANDA: Vorhersage der Änderung der Proteindynamikbindungseffizienz bei Mutationen unter Verwendung von Sequenzinformationen

Die präzise Bestimmung der Änderung der Protein-Bindungsaffinität bei Mutationen ist von entscheidender Bedeutung für die Entdeckung und Entwicklung neuer Therapeutika sowie zur Unterstützung von Mutagenese-Studien. Die Ermittlung der Affinitätsänderung bei Mutationen erfordert aufwendige, kostspielige und zeitaufwendige experimentelle Methoden im Labor, die durch rechnergestützte Ansätze unterstützt werden können. Die meisten existierenden rechnergestützten Vorhersagemethoden erfordern jedoch Proteinstrukturen, was ihre Anwendbarkeit auf Protein-Komplexe mit bekannter Struktur einschränkt. In dieser Arbeit untersuchen wir die sequenzbasierte Vorhersage der Änderung der Protein-Bindungsaffinität bei Mutationen. Statt Proteinstrukturen nutzen wir ausschließlich Sequenzinformationen in Kombination mit Machine-Learning-Techniken, um die Änderung der Bindungsaffinität präzise vorherzusagen. Wir stellen einen neuartigen, sequenzbasierten Predictor namens PANDA vor, der gegenüber bestehenden Methoden auf derselben Validierungsdatenmenge sowie auf einer externen, unabhängigen Testdatenmenge eine höhere Genauigkeit erzielt. Auf der externen Testdatenmenge erreicht unsere Methode einen maximalen Pearson-Korrelationskoeffizienten von 0,52, während die aktuell beste strukturbasierte Methode, MutaBind, einen maximalen Wert von 0,59 erreicht. Unser vorgeschlagener sequenzbasierter Ansatz zur Vorhersage von Affinitätsänderungen bei Mutationen weist eine weite Anwendbarkeit auf und erzielt eine vergleichbare Leistung im Vergleich zu bestehenden strukturbasierten Methoden. Eine webbasierte, cloud-basierte Implementierung von PANDA sowie der Python-Code sind unter https://sites.google.com/view/wajidarshad/software und https://github.com/wajidarshad/panda verfügbar.