Neues KI-Tool entdeckt versteckte Mikroproteine im menschlichen Genom
Ein neu entwickeltes KI-Tool namens ShortStop ermöglicht es Wissenschaftlern, bisher unbekannte Mikroproteine im menschlichen Genom aufzuspüren – jene winzigen Moleküle, die lange Zeit im „dunklen“ Teil des Erbguts versteckt waren. Das Salk Institute for Biological Studies hat das Tool entwickelt, um die sogenannten kleinen offenen Leseraster (smORFs) in der DNA zu analysieren, die bisher als nicht kodierend abgetan wurden. Diese Regionen wurden lange als „Abfall-DNA“ betrachtet, doch neue Erkenntnisse zeigen, dass sie wichtige Anweisungen für Mikroproteine enthalten, die nur wenige bis maximal 150 Aminosäuren lang sind und daher mit herkömmlichen Methoden schwer nachzuweisen sind. ShortStop nutzt maschinelles Lernen, um zwischen funktionellen und nicht-funktionellen smORFs zu unterscheiden. Dabei vergleicht das System reale DNA-Sequenzen mit einer Datenbank künstlich generierter, zufälliger smORFs als Negativkontrolle. Auf diese Weise kann es in großen öffentlichen Datensätzen wie RNA-Sequenzierungen schnell potenziell biologisch relevante Mikroproteine identifizieren – ohne dass Forscher jedes einzelne Molekül erst im Labor testen müssen. Bei der Anwendung auf ein Lungenkrebs-Dataset fand das Team 210 neue Mikroproteinkandidaten, darunter ein besonders auffälliges, das in Tumorgewebe stärker exprimiert war als in gesundem Gewebe. Dieses Mikroprotein könnte sich als Biomarker oder therapeutisches Ziel für Lungenkrebs eignen. Das Tool ist besonders wertvoll, weil es mit gängigen Datenformaten arbeitet, die bereits von vielen Laboren genutzt werden. Dadurch können Forscher Mikroproteine in gesundem und krankem Gewebe großflächig vergleichen – eine Schlüsselvoraussetzung, um neue Erkenntnisse über Krankheiten wie Alzheimer, Diabetes oder Fettleibigkeit zu gewinnen. „Wir können jetzt mit bestehenden Daten arbeiten, ohne neu zu experimentieren“, sagt Erstautor Brendan Miller. „Das beschleunigt die Entdeckung von Mikroproteinen um ein Vielfaches.“ Die Ergebnisse wurden in der Fachzeitschrift BMC Methods veröffentlicht. Die Arbeit unterstreicht, dass das menschliche Genom möglicherweise weit mehr Mikroproteine enthält, als bisher angenommen. Diese winzigen Moleküle könnten entscheidende Rollen bei der Regulation von Zellfunktionen, Signalübertragung und Krankheitsentstehung spielen. Kurzfristig könnte ShortStop die Forschung in der Krebsbiologie, Neurologie und Medizin revolutionieren, indem es den Weg zu neuen Diagnosemethoden und gezielteren Therapien ebnen könnte. Industrielle Experten loben das Tool als Meilenstein in der Genomforschung. „ShortStop ist ein Paradigmenwechsel“, sagt eine Biotechnologie-Analystin. „Es transformiert die Suche nach Mikroproteinen von einer mühsamen, kostspieligen Prozedur in eine datengetriebene, skalierbare Strategie.“ Das Salk Institute, bekannt für bahnbrechende Entdeckungen in der Zellbiologie und Genomik, positioniert sich mit dieser Innovation an der Spitze der bioinformatischen Forschung. Mit weiteren Kooperationen mit anderen Instituten könnte das Potenzial von ShortStop in der personalisierten Medizin noch deutlich steigen.