HyperAIHyperAI

Command Palette

Search for a command to run...

KI entschlüsselt weite DNA-Signale für RNA-Spleißen

Forscher der Universität Tokio haben ein neues KI-Modell entwickelt, das weitreichende regulatorische Signale in der DNA entschlüsselt und die Vorhersage des RNA-Splicings entscheidend verbessert. Das Verfahren trägt den Namen SpliceSelectNet (SSNet) und wurde von Professor Kenta Nakai sowie Promovendin Yuna Miyachi am Human Genome Center der Universität Tokio entwickelt. Die Ergebnisse wurden kürzlich in der Fachzeitschrift Nucleic Acids Research publiziert. Die präzise Regulation des RNA-Splicings ist für die Genexpression und die menschliche Gesundheit von zentraler Bedeutung. Bisherige KI-Modelle stießen jedoch an Grenzen, da sie regulatorische DNA-Abschnitte, die tausende Basenpaare von den eigentlichen Spleißstellen entfernt liegen, kaum erfassen konnten. Dies erschwerte die Analyse krankheitsauslösender Mutationen und komplexe Einblicke in die RNA-Prozessierung, insbesondere bei genetischen Erkrankungen und Krebs. Um diese Limitierung zu überwinden, implementierte das Forschungsteam ein hierarchisches Transformer-Netzwerk, das DNA-Sequenzen mit einer Länge von bis zu 100.000 Basenpaaren analysiert, ohne die Auflösung auf Einzelbasis-Ebene zu verlieren. Durch die Aufteilung langer Sequenzen in kleinere Blöcke und die nachgelagerte Integration via hierarchischer Aufmerksamkeitsmechanismen lässt sich der Rechenaufwand erheblich reduzieren, während gleichzeitig lokale und globale regulatorische Muster erfasst werden. Die Visualisierung der Aufmerksamkeitswerte ermöglicht zudem eine direkte biologische Interpretation der vom Modell als relevant eingestuften Genomregionen. Bei Benchmark-Tests gegen führende Spleißvorhersagesysteme erzielte SSNet durchgängig state-of-the-art Ergebnisse. Sowohl bei der Identifikation klassischer Spleißstellen als auch bei der Detektion aberranten Spleißens übertraf das Modell etablierte Ansätze. Simulationen am DMD-Gen sowie Evaluierungen pathogener Varianten aus der ClinVar-Datenbank bestätigten die hohe Sensitivität des Modells für weit entfernte regulatorische Einflüsse, die mit herkömmlichen Faltungsneuronalen Netzen nicht abbildbar sind. Nach Einschätzung der Entwickler adressiert SSNet ein grundlegendes Manko bestehender Genom-KI: Viele Architekturansätze wurden unkritisch vom Natural Language Processing übernommen, obwohl DNA strukturell und funktionell deutlich komplexere Langstreckeninteraktionen aufweist. Durch die gezielte Neuausrichtung der Netzwerkarchitektur wurde eine größere Übereinstimmung mit biologischen Gegebenheiten erreicht. Die Anwendungen des Frameworks gehen weit über die Spleißstellenvorhersage hinaus. Das zugrundeliegende Architekturprinzip eignet sich potenziell zur Erforschung von Promoter-Enhancer-Interaktionen, zur Modellierung der dreidimensionalen Genomorganisation und als Basis für erweiterte DNA-Sprachmodelle. Im klinischen Kontext könnte SSNet beim Screening nichtkodierender Varianten unklarer Signifikanz helfen, während die Pharmaindustrie den Ansatz zur Entwicklung oligonukleotidbasierter Therapeutika gegen fehlerhaftes Spleißen nutzen könnte. Mit SSNet steht nun ein leistungsfähiges Werkzeug bereit, das Vorhersagegenauigkeit mit biologischer Nachvollziehbarkeit verbindet und die Präzisionsgenomik einen entscheidenden Schritt voranbringt.

Verwandte Links