Chinesische Forscher entwickeln RNA-Spleiß-Modell
Ein Forschungsteam am Beijing Institute of Genomics der Chinesischen Akademie der Wissenschaften hat das KI-Modell HELIX entwickelt, um die Vorhersage von RNA-Spleißmustern auf Transkriptebene zu revolutionieren. RNA-Spleiß ist ein zentraler Prozess, der durch die Entstehung diverser Transkriptvarianten die Sequenz, Struktur und Funktion von Proteinen steuert. Während neue Sequenzierungstechnologien mit langen Reads Einblicke in die relativen Anteile verschiedener Isoformen ermöglichen, fehlen bisher oft ausreichende Daten aus komplexen physiologischen Zuständen, um präzise Analysen durchzuführen. Bestehende Algorithmen können lediglich die Stärke einzelner Spleißstellen in einzelnen Proben abschätzen, weisen jedoch Schwächen bei der Vorhersage ganzer Transkripte und der Übertragung auf unbekannte Gewebetypen auf. HELIX überwindet diese Limitierungen, indem es genomische Sequenzdaten mit organspezifischen Matrizen der Expression von RNA-bindenden Proteinen integriert. Das Modell basiert auf einem kontextabhängigen Spleißregulationsmechanismus und nutzt eine verschachtelte Strategie aus hierarchischen tiefen neuronalen Netzen. Zunächst werden Spleißstellen und deren Basistärke anhand der DNA-Sequenz vorhergesagt. Diese Informationen werden mit den Expressionsprofilen von 1.499 RNA-bindenden Proteinen verknüpft, um das regulatorische Niveau spezifischer Proben präzise zu bestimmen. Abschließend analysiert ein auf Längs-Fortschrittsspeicher basierendes Netzwerk, das auf eingebetteten Merkmalen aufbaut, die Abhängigkeiten zwischen mehreren Spleißstellen. Tests belegen, dass HELIX bei hochregulierten Spleißstellen und der Vorhersage relativer Transkriptverhältnisse deutlich bessere Ergebnisse liefert als herkömmliche Methoden. Die praktische Anwendung des Modells wurde am Beispiel einer großen Kohorte von Darmkrebspatienten demonstriert. HELIX identifizierte systematische Störungen des Spleißens und abnormale Muster der Transkriptnutzung in Tumorzellen. Diese Befunde stehen in enger Korrelation mit genomischen Mutationen, Dysregulationen bei RNA-bindenden Proteinen und klinischen Parametern. Die Ergebnisse liefern neue molekulare Anhaltspunkte zum Verständnis von Tumorentstehungsmechanismen und zur stratifizierten Behandlung von Patienten. Darüber hinaus erweiterte das Team die Architektur um scHELIX, eine Version für Einzelzellanalysen. Dieses Tool ermöglicht es, Unterschiede in der Transkriptnutzung zwischen verschiedenen Zelltypen und Tumorsubgruppen innerhalb eines Tumors aufzudecken. Die Analyse zeigte deutliche Unterschiede im Spleißverhalten zwischen verschiedenen Tumorklonteilen, was neue Perspektiven für die Erforschung der Tumorevolution und die Identifikation therapeutischer Angriffspunkte eröffnet. Diese Forschung trägt maßgeblich zum Verständnis organspezifischer und krankheitsassoziierter Spleißmechanismen bei und bietet methodische Grundlagen für die Krebsklassifikation, die Interpretation krankheitsverursachender Varianten und die Entwicklung personalisierter Medizinmedizinischer Ansätze. Die Ergebnisse wurden im Fachjournal Nature Computational Science veröffentlicht. Das Projekt wurde unter anderem vom National Natural Science Foundation of China finanziell unterstützt.
