LASSO-MOGAT: Ein Multi-Omik-Graph-Attention-Framework für die Krebsklassifizierung

Die Anwendung von maschinellem Lernen zur Analyse von Veränderungen in den Genexpressionsmustern ist kürzlich als eine mächtige Methode in der Krebsforschung hervorgetreten, die unser Verständnis der molekularen Mechanismen, die die Entstehung und Progression von Krebs unterliegen, erheblich verbessert. Die Kombination von Genexpressionsdaten mit anderen Omikstypen wurde in zahlreichen Arbeiten als Mittel zur Verbesserung der Ergebnisse bei der Krebsklassifikation berichtet. Trotz dieser Fortschritte bleibt es jedoch weiterhin schwierig, hochdimensionale Multi-Omics-Daten effektiv zu integrieren und die komplexen Beziehungen zwischen verschiedenen biologischen Ebenen zu erfassen. In dieser Arbeit wird LASSO-MOGAT (LASSO-Multi-Omics Gated Attention) vorgestellt, ein neues graphbasiertes Tiefenlernframework, das Daten von Messenger-RNA, Mikro-RNA und DNS-Methylierung integriert, um 31 Krebstypen zu klassifizieren. Durch die Nutzung einer Differenzialausdrucksanalyse mit LIMMA und einer LASSO-Regression zur Merkmalsauswahl sowie durch den Einsatz von Graph Attention Networks (GATs), um Proteine-Proteine-Interaktionsnetze (PPI-Netze) einzubeziehen, erfasst LASSO-MOGAT effektiv komplexe Beziehungen innerhalb der Multi-Omics-Daten. Experimentelle Validierung mittels fünf-fach gekreuzter Validierung zeigt die Präzision, Zuverlässigkeit und Fähigkeit des Verfahrens, umfassende Einblicke in die molekularen Mechanismen des Krebses zu liefern. Die Berechnung der Aufmerksamkeitskoeffizienten für die Kanten im Graphen durch das vorgeschlagene graph-basierte Aufmerksamkeitsarchitektur auf Basis von Proteine-Proteine-Interaktionen erwies sich als nützlich für die Identifikation von Synergien in den Multi-Omics-Daten zur Krebsklassifikation.