KI entschlüsselt pflanzliche DNA-Schalter zur Genregulation
Ein internationales Forschungsteam unter der Federführung des Forschungszentrums Jülich und des IPK Leibniz-Instituts hat ein auf Deep Learning basierendes Modell entwickelt, das die Interaktion zwischen regulatorischen Proteinen und pflanzlicher DNA präzise vorhersagt. Die in Nature Communications veröffentlichten Ergebnisse eröffnen neue Perspektiven, um zu verstehen, wie genetische Variationen Pflanzen bei der Anpassung an Umweltstress helfen. Während das Genom traditionell vor allem als Speicher aktiver Gene betrachtet wird, steuern regulatorische DNA-Abschnitte maßgeblich deren Aktivität. Die Forschung konzentriert sich dabei auf Transkriptionsfaktoren, die an spezifische DNA-Stellen binden und als molekulare Schalter fungieren. Das neu entwickelte KI-Modell wurde ausschließlich mit genomischen Daten der Modellpflanze Arabidopsis thaliana trainiert. Im Gegensatz zu früheren Ansätzen, die für jeden Transkriptionsfaktor separat Modelle erstellten, setzt das neue System auf ein Multi-Label-Design. Es erkennt simultan die Bindungsmuster von 46 Transkriptionsfaktor-Familien. Erstautor Fritz Forbang Peleke betonte, dass Transkriptionsfaktoren nicht isolierte DNA-Motive ablesen, sondern den genomischen Kontext und die Anordnung regulatorischer Signale entscheidend sind. Diese regulatorische Grammatik ermöglichte es dem Team, Tausende von Arabidopsis-Genen in 14 breite regulatorische Cluster einzuordnen, die sich stark mit gemeinsamen biologischen Funktionen und koordinierter Genaktivität decken. Durch die Verknüpfung der Vorhersagen mit über 7.000 genomweit bekannten DNA-Varianten, die Merkmale wie Blühzeitpunkt, Krankheitsresistenz und Keimlingswachstum beeinflussen, ließ sich nachweisen, dass etwa 20 Prozent dieser Varianten die Bindung von Transkriptionsfaktoren verändern. Dr. Jędrzej Szymański vom IPK und Forschungszentrum Jülich erklärte, dass dadurch der Schritt von rein statistischen Assoziationen zu plausiblen molekularen Mechanismen gelingen könne. Ein konkretes Beispiel betraf eine einzelne Basenänderung in einem regulatorischen Bereich, die laut Modell die Bindung mehrerer Transkriptionsfaktoren gleichzeitig modifiziert. Dies wurde erfolgreich durch Hochdurchsatz-Reporter-Assays experimentell bestätigt. Besonders bemerkenswert ist die Übertragbarkeit des Modells. Obwohl es ausschließlich an Arabidopsis trainiert wurde, ließ es sich nahtlos auf die verwandte Nutzpflanze Mais anwenden. Dort identifizierte es spezifische Transkriptionsfaktoren, die unter Hitzestress aktiv werden, darunter bekannte Hitzeschockfaktoren. Diese Fähigkeit zum Gattungstransfer zeigt, dass die Methode auch für Kulturen mit kaum vorhandenen experimentellen Daten wertvolle Annotationen liefern kann. Die Forschung stellt damit ein leistungsfähiges Werkzeug bereit, das die Züchtung resilienter Sorten beschleunigen und das Verständnis komplexer Genregulationsnetzwerke fundamental vorantreiben wird.
